Warning: Parameter 1 to wp_default_styles() expected to be a reference, value given in /homepages/11/d622453770/htdocs/clickandbuilds/SocialTechMonkeys/wp-includes/plugin.php on line 601

Warning: Parameter 1 to wp_default_scripts() expected to be a reference, value given in /homepages/11/d622453770/htdocs/clickandbuilds/SocialTechMonkeys/wp-includes/plugin.php on line 601

Categoría: Lenguaje Natural

Deep Learning es una  técnica de aprendizaje artificial que ya ha dotado a los ordenadores de una capacidad para reconocer la voz, clasificar imágenes, videos y ha realizado impresionantes avances en procesamiento de lenguaje natural.

Deep Learning implica la aplicación repetida de cálculos a los datos, que pueden ser imágenes o sonido, para reconocer atributos clave y similitudes. Aunque existen varias maneras de implementar Deep Learning, una de las más comunes es utilizar redes de neuronas. Una red de neuronas es una herramienta matemática que modela, de forma muy simplificada, el funcionamiento de las neuronas en el cerebro. Otra forma de verlas, es como un procesador de información, que recibe información entrante, codificada como números, hace un poco de magia, y produce como resultado información saliente, codificada como otros números.

Los principios matemáticos que forman la base del aprendizaje profundo son relativamente sencillos, pero cuando se combinan con enormes cantidades de datos de aprendizaje y sistemas informáticos que ejecutan múltiples operaciones en paralelo, la técnica ha dado paso a grandes avances en los últimos años, sobre todo en los campos de reconocimiento de voz e imágenes.

Por ejemplo, Google utiliza aprendizaje profundo para el reconocimiento de voz en móviles Android, mientras que Facebook utiliza la tecnología para identificar amigos en las fotos de sus usuarios.   Andrew Ng, profesor adjunto de la Universidad de Stanford (USA), cocreador de Coursera (mis agradecimientos) y  director de Tecnología de la empresa china Baidu, Andrew Ng, dijo en la conferencia que el aprendizaje profundo ya ha demostrado su utilidad. «Una de las cosas que Baidu hizo muy bien desde el principio fue crear una plataforma interna de aprendizaje profundo», dijo Ng. «Un ingeniero de nuestro grupo de sistemas decidió utilizarlo para identificar con un día de antelación cuándo va a fallar el disco duro. Utilizamos aprendizaje profundo para detectar intrusiones. Ahora mucha gente está aprendiendo acerca del aprendizaje profundo y lo intentan aplicar a muchos problemas distintos».

Para campañas de social media, deep learning puede reconocer la identificación de usuarios así como sus gustos y preferencias, extraídas de imágenes y/o videos.  Por ejemplo de una foto de un grupo de amigos en una fiesta, se puede identificar a cada uno de ellos, reconociéndolos por sus similitudes con fotos de perfiles en redes sociales. Incluso se puede extraer características de productos asociados a la imagen, como por ejemplo bebidas, marcas de ropa, sitios de interés, para con esa información realizar campanas personalizadas de contenido.

Les dejo el video de Andrew Ng y los avances en Deep Learning.  El lo cataloga como el estado del arte en aprendizaje no supervizado .

Social Mention (socialmention.com) una plataforma de búsqueda de medios de comunicación social que consolida contenido generado por los usuarios en todo el internet, en un único flujo de información. Social Mention puede rastrar la influencia de un tema determinado en más de 80 medios sociales entre ellos: Twitter, Facebook, LinkedIn, YouTube, Google, Digg, etc.

Social Mention, ademas proporciona el servicio de alertas diarias de medios sociales y mide la influencia utilizando 4 parámetros, apoyado en algoritmos de procesamiento de lenguaje natural:

  • Fuerza (Strength). Es la probabilidad de que una marca se está discutiendo en los medios sociales. Se lo calcula de forma muy simple: las frases mencionadas en las últimas 24 horas se divididas por el total de posibles menciones.
  • Sentimiento (Sentiment). Es el promedio de menciones positivas y negativas.
  • Pasión (Passion). Es una medida de la probabilidad de que las personas que hablan de una marca, lo hagan otra vez. Por ejemplo, si existiera un pequeño grupo de apasionados defensores  que hablan de productos o marca específicos todo el tiempo, se calculara una puntuación más alta en pasión. Por el contrario, si cada mención ha sido escrita por un autor diferente, se obtendrá una puntuación más baja.
  • Alcance (Reach).  Es una medida del rango de influencia. Es el número de autores únicos que hacen referencia a una marca, dividido por el número total de menciones.

Por el momento nos enfocaremos en el análisis de sentimientos, sin desmerecer a las otras métricas. El sentimiento es bastante sencillo de entender. Puede entenderse como una emoción, una actitud u opinión. En las redes sociales, el sentimiento de una publicación puede apreciarse en el tono o la emoción transmitida por una mención de la marca.

¿Para que nos puede servir este análisis de sentimientos con la herramienta Social Mention?. Con solo un vistazo nos aseguramos que nuestra marca  está respondiendo a los clientes insatisfechos lo más rápido posible, al consultar las menciones positivas, negativas y neutrales. También podemos recopilar datos sobre las tendencias de sensibilidad y patrones y utilizarlo para obtener una mejor imagen de la reputación de su marca.

El análisis de sentimientos nos permite estar a la expectativa de una posible crisis. Los profesionales de relaciones públicas pueden tomar acciones ante una situación difícil detectada,  antes de que se convierta en un problema mayor.

Por ultimo nos permite llevar a cabo una investigación competitiva. Mediante la creación de alertas para vigilar a competidores, nos permite medir el sentimiento para ellos, en la misma forma que se lo puede medir para una marca propia. El análisis de opiniones y sentimientos puede medir e informar sobre cómo se habla sobre los competidores en las redes sociales.

socialmention

Figura: Análisis en Social Mention, del hashtag: «Social Media»

 

Lexalytics  Inc. fue formada en el 2003 proporciona  el servicio de análisis de intenciones y sentimientos a partir de texto,  hacia empresas que utilizan SaaS (Modelo de distribución de software donde el soporte lógico y los datos se acceden vía Internet desde un cliente) y la tecnología basada en la nube.  El motor detrás Lexalytic:  Salience 6, fue construido como un motor de análisis de texto  varios idiomas.

La entrada para realizar el analisis de texto, se denomina documento y su origen puede ser cualquier sitio de social media, como blogs, foros, redes sociales (Twitter, Linkedin, Facebook), sitios de videos, comunidades, sitios de noticias, entre otros.  La herramientas y código analizan el texto y localizan las porciones del documentos mas significantes, las que se denominas Snippets.

El motor de análisis de texto, procesa 3 billones de documentos diarios, usando para ello infraestructura para Big Data.

 

lexa3

El motor de análisis de texto, que se basa en algoritmos de procesamiento de lenguaje natural, puede identificar entidades, temas, tópicos, categorías, intenciones y sentimientos desde el documento de entrada.  A partir de esta información, se  puede identificar los actores de importancia, el peso positivo o negativo de los sentimientos y la clasificación temática del documento en todo su contexto. El documento puede ser una imagen o un video, que puede ser tratado mediante algoritmos de procesamiento de imágenes, para  identificar sujetos, edades, razas, estados de animo, lugares e incluso el uso de determinados objetos y marcas.

Se realizo una prueba desde el sitio https://www.lexalytics.com/demo con una noticia sobre el terremoto en Ecuador, documento que esta en el siguiente enlace: http://www.eluniverso.com/noticias/2016/04/18/nota/5532609/fiscalia-entrega-lista-cadaveres-entregados-86-manta-22-canoa-10

lexa2

El resultado después del análisis, fue que el documento en su contexto general es negativo, e identifico las entidades, categorías y principales temas.

lexa1

lexa4

El servicio de Lexalytics, tiene mucho potencial, por ejemplo realizar estrategias de marketing digital, focalizadas a satisfacer necesidades emocionales de sujetos (entidades) que han expresado sus sentimientos (positiva o negativa) al tratar un tema especifico en un documento (una publicación de Facebook, un Tweet, o incluso un video).

IBM Bluemix, es una herramienta poderosa para crear aplicaciones inteligentes que realizan análisis de contenido en el texto y las imágenes. El uso de algoritmos  NLP, de reconocimiento de imágenes y aprendizaje automático permite a los interesados,  extraer metadatos semánticos a partir del contenido, tales como información sobre personas, lugares, empresas, temas, hechos, relaciones, autores e idiomas.

Continuando nuestro ejemplo referente al hashtag: «Terremoto Ecuador».  Usamos el servicio de dashDB para extraer datos de Twitter para procesarlos.  Este servicio permite bajar hasta 20 GB de información y permite aplicar a los datos, un algoritmo de procesamiento de lenguaje natural para determinar si en el cuerpo del mensaje hay texto que denote sentimientos positivos o negativos.

Esta información con respecto a la polaridad de los sentimientos, puede servir por ejemplo para filtrar por regiones, el estado de animo, emociones y necesidades de una determinada población y anticiparse a gestionar la ayuda requerida. En el sentido comercial puede servir para conocer el efecto positivo o negativo en una campaña en redes sociales por áreas o zonas, con el fin de tomar correctivos.

En el ejemplo aplicamos el siguiente Query para extraer los tweets con sentimientos positivos, usuarios y locaciones.

SELECT A.MESSAGE_BODY, B.SENTIMENT_TERM, C.USER_SCREEN_NAME, C.USER_NAME

FROM
DASH101145.TERR_TWEETS A, DASH101145.TERR_SENTIMENTS B, DASH101145.TERR_USERS C WHERE
A.MESSAGE_ID = B.MESSAGE_ID AND
B.SENTIMENT_POLARITY = ‘POSITIVE’ AND
A.MESSAGE_ID = C.MESSAGE_ID

Adicional presenta un Framework para desarrollar en lenguaje R y realizar gráficos y estadísticas.  Pueden realizarse aplicaciones mas elaboradas con opciones de búsqueda por varios filtros, selección de lenguaje, etc.

Configuración de búsqueda de palabras o hashtag en Twitter para extracción y procesamiento de datos

Query con los resultados de las tablas extraídas y procesadas.