Posteado por: Jose David Baena | julio 30, 2007

Dia 5 – Charla “The Joy of ‘Phighting’ Email Spam”

El ponente fue Tobias Scheffer.

La charla trataba sobre Phising, Pharming y Spam.

Una de las cosas que vi que eran más afines con las materias que doy en la facultad fue la clasificacion de texto en “spam” o “no spam”.

Esto consiste en crear un modelo de clasificador a partir de el análisis de muchos documentos de texto(corpus). El analizador mediante diferentes técnicas va elaborando un modelo a partir de ese corpus, que será el que definitivamente clasifique el documento; en nuestro caso spam o no spam.

Nos contaba que los spammers crean una especie de plantillas, en las cuales sustituyen determinados campos, para que no les sea tan fáciles a los analizadores comentados anteriormente el saber que son spam.El reto que se nos propuso fue el de crear un analizador que te filtrara todo el spam.

Yo tuve una asignatura en la facultad llamada “Introducción al Procesamiento del Lenguaje Natural” en la cual creamos un clasificador de documentos.Esta aplicación me ha sido muy útil despues para catalogar datos que obtenía de Internet. Si alguien está interesado en el tema, que me mande un correo y podemos intercambiar información.

¿Sabías que…

… la palabra SPAM viene de una marca de carne en lata que gritaban en las películas de los Monty Python? Para mas información ver el enlace en la Wikipedia.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Categorías

A %d blogueros les gusta esto: