Wiadomości
Interdyscyplinarne blokowanie spamu
11 sierpnia 2011 11:23,
Antoni Steliński
Nina Balcan - specjalistka z Georgia Institute of Technology - opracowała nową metodę wykrywania i blokowania spamu. Stworzone przez nią rozwiązanie wykorzystuje technologie z zakresu uczenia się maszyn oraz teorii gier.
System opracowany przez Balcan może posłużyć do tworzenia spersonalizowanych, profilowanych pod kątem konkretnych użytkowników, systemów antyspamowych, które będą w stanie samodzielnie i trafnie klasyfikować wiadomości. Technologię tę docenił Microsoft - Nina Balcan została niedawno stypendystką programu Microsoft Research Faculty (na kontynuowanie swoich prac z zakresu zwalczania spamu dostała 200 tys. USD).
Zdaniem specjalistki, rezultaty jej prac mogą przydać się nie tylko przy walce ze spamem - opracowana przez nią technologia znajdzie również zastosowanie w data miningu. Jej celem było nauczenie komputera podejmowania trafnych decyzji co do tego, czy dana wiadomość jest pożądana, czy nie. "Można to zrobić na kilka sposobów - jednym z nich jest tzw. nadzorowane uczenie, w którym komputerowi przedstawia się różne wiadomości i pokazuje, które z nich są spamem, a które nie. Ta metoda ma jednak poważne ograniczenia - jednym z najważniejszych jest to, że aby zadziałała, użytkownik musi wcześniej samodzielnie oznaczyć dużą pulę wiadomości e-mail" - tłumaczy Balcan.
Lepszą metodą jest według niej "aktywna nauka" - w tym przypadku komputer sam analizuje bazę niezidentyfikowanych wiadomości, a decyzje podejmuje na podstawie odpowiedzi na "pytania pomocnicze", sporadycznie zadawane użytkownikowi. Zastosowanie takiego rozwiązania zmniejsza zaangażowanie człowieka, a dodatkowo sprawia, że komputer szybciej uczy się rozpoznawania typowych cech spamu.
"Aktywna nauka jest zdecydowanie lepszym rozwiązaniem niż nadzorowana - daje lepsze rezultaty. Oczywiście, rozwiązanie to ma również swoje wady, jedną z najważniejszych jest wysoka podatność na błędy wynikające z błędnej klasyfikacji wiadomości. Chodzi o to, że jedna błędnie uznana za spam wiadomość może poważnie zakłócić proceks uczenia się komputera" - mówi Balcan.
Specjalistka tłumaczy, że jej celem jest opracowanie systemu, który będzie w stanie szybko i trafnie stwierdzić, jaka metoda wykrywania spamu optymalnie sprawdzi się w danym przypadku. "Moje badania łączą zagadnienia z zakresu uczenia się maszyn, teorii gier, ekonomii oraz optymalizacji" - wyjasnia Nina Balcan.
W czasie swoich prac specjalista współpracowała m.in. ze ekspertami z zakresu statystyki, teorii gier, teorii informatyki oraz biotechnologii. Przyznane jest stypendium na zostać przeznaczone na kontynuowanie tych prac oraz najróżniejsze badania interdyscyplinarne oraz na zatrudnienie dodatkowych asystentów.
Zdaniem specjalistki, rezultaty jej prac mogą przydać się nie tylko przy walce ze spamem - opracowana przez nią technologia znajdzie również zastosowanie w data miningu. Jej celem było nauczenie komputera podejmowania trafnych decyzji co do tego, czy dana wiadomość jest pożądana, czy nie. "Można to zrobić na kilka sposobów - jednym z nich jest tzw. nadzorowane uczenie, w którym komputerowi przedstawia się różne wiadomości i pokazuje, które z nich są spamem, a które nie. Ta metoda ma jednak poważne ograniczenia - jednym z najważniejszych jest to, że aby zadziałała, użytkownik musi wcześniej samodzielnie oznaczyć dużą pulę wiadomości e-mail" - tłumaczy Balcan.
Lepszą metodą jest według niej "aktywna nauka" - w tym przypadku komputer sam analizuje bazę niezidentyfikowanych wiadomości, a decyzje podejmuje na podstawie odpowiedzi na "pytania pomocnicze", sporadycznie zadawane użytkownikowi. Zastosowanie takiego rozwiązania zmniejsza zaangażowanie człowieka, a dodatkowo sprawia, że komputer szybciej uczy się rozpoznawania typowych cech spamu.
"Aktywna nauka jest zdecydowanie lepszym rozwiązaniem niż nadzorowana - daje lepsze rezultaty. Oczywiście, rozwiązanie to ma również swoje wady, jedną z najważniejszych jest wysoka podatność na błędy wynikające z błędnej klasyfikacji wiadomości. Chodzi o to, że jedna błędnie uznana za spam wiadomość może poważnie zakłócić proceks uczenia się komputera" - mówi Balcan.
Specjalistka tłumaczy, że jej celem jest opracowanie systemu, który będzie w stanie szybko i trafnie stwierdzić, jaka metoda wykrywania spamu optymalnie sprawdzi się w danym przypadku. "Moje badania łączą zagadnienia z zakresu uczenia się maszyn, teorii gier, ekonomii oraz optymalizacji" - wyjasnia Nina Balcan.
W czasie swoich prac specjalista współpracowała m.in. ze ekspertami z zakresu statystyki, teorii gier, teorii informatyki oraz biotechnologii. Przyznane jest stypendium na zostać przeznaczone na kontynuowanie tych prac oraz najróżniejsze badania interdyscyplinarne oraz na zatrudnienie dodatkowych asystentów.
Komentarze (0)
- Prawo Moore’a zagrożone?
- Bezpieczeństwo WiFi - bezprzewodowe testy penetracyjne
- Wirtualizacja: obsługa SMB na czterech U
- Prawdziwe powody powstania Microsoft Open Technologies
- Open source: zmierzch ery GPL? Nie do końca...
- ROVER - prosty sposób na słabość BGP?
- Zaawansowane stacje Wi-Fi Ruckus Wireless
- Rozstanie z Javą nie będzie proste
- Google Drive uwypukla słabe strony publicznych chmur obliczeniowych
- Serwery "zombie" w centrum danych
Reklama
Huawei celuje w rynek biznesowy
Huawei nieustannie rozwija się jako dostawca infrastruktury dla branży telekomunikacyjnej. W tym roku chiński koncern zamierza umocnić swoją pozycję również na rynku rozwiązań Enterprise.
Polecane
Koniec Windows XP początkiem problemów?
Microsoft oficjalnie potwierdził, że za dwa lata definitywnie zakończy się era Windows XP - systemu operacyjnego,...
Spokój i luz administratora
Wymagania wobec pracowników działów IT rosną proporcjonalnie do stopnia rozwoju teleinformatyki. Oczekuje się, że...
