A medida que el mundo se vuelve cada vez más interconectado y los sistemas cada vez más complejos, es imperativo utilizar tecnologías creadas para aprovechar las relaciones y sus características dinámicas. Las empresas de hoy se enfrentan a desafíos y oportunidades extremadamente complejos que requieren enfoques más flexibles e inteligentes.

El marco de gráfico empresarial para científicos de datos tiene como objetivo mejorar las predicciones que impulsan mejores decisiones e innovación. Neo4j para Graph Data Science incorpora el poder predictivo de las relaciones y las estructuras de red en los datos existentes para responder preguntas que antes eran intratables y aumentar la precisión de la predicción.

OpenGov Asia tuvo la oportunidad de hablar con marco de la doctora aliciadirector sénior de gestión de productos en neo4jpara obtener sus conocimientos sobre Graph Data Science.

Alicia es la líder de Neo4j para todo lo relacionado con Graph Data Science: trabaja en estrecha colaboración con ingeniería para construir una plataforma de clase mundial para la ciencia de datos conectada, colaborando con clientes y profesionales para comprender cómo se pueden poner en práctica los gráficos y educando a la comunidad de ciencia de datos en el poder de las conexiones.

Neo4j es una empresa de gráficos que se dedica a determinar las conexiones dentro de los datos para obtener información. Sin encontrar conexiones, los datos en sí mismos pueden no tener un significado procesable. Las organizaciones necesitan conexiones para dar sentido a puntos de datos que de otro modo estarían aislados.

Alicia diferencia una plataforma de base de datos de una plataforma de ciencia de datos. En una base de datos, las organizaciones pueden almacenar sus datos y pueden consultar cosas importantes y buscarlas. La ciencia de datos se trata de aprovechar las conexiones entre miles de millones o incluso billones de puntos de datos. Graph para la ciencia de datos está aprovechando esas conexiones para descubrir qué es importante y significativo.

Requisitos de la industria para aprovechar los datos

Hay tres requisitos principales. Primero, a medida que las organizaciones tienen más datos, la velocidad de la capacidad de acceder, recuperar e interpretar datos se vuelve importante; ya sea la velocidad de la consulta o qué tan rápido funciona el algoritmo.

Lo segundo es la expresividad. Cuantos más datos hay, más importante es que los datos representen algo significativo. En el contexto de un gráfico, las organizaciones necesitan estructurar los datos de la misma forma en que se representan en la vida real.

El punto final es que cuantos más datos tengan las organizaciones, más difícil será saber exactamente qué buscar en un conjunto de datos. Tener las herramientas para buscar los patrones importantes se vuelve crucial. Por lo tanto, los usuarios finales pueden enfocar su valor en lo que es importante en lugar de pasar años revisando información inútil.

En la conversación de OpenGov Asia con Nik Vora, vicepresidente de Asia-Pacífico, explica que la tecnología de gráficos es importante porque puede extraer el valor inherente de los datos mismos. El propósito de la tecnología es almacenar información sin restringirla a un modelo predefinido.

Alicia está de acuerdo con esto. Una plataforma de datos gráficos no solo representa puntos de datos individuales, sino todas las conexiones entre ellos. Almacenar datos tradicionalmente podría perder esa parte crítica de la información, como la relación entre dos personas o elementos. Graph Data Platform representa fielmente los datos; las relaciones y conexiones se conservan. Cuando las organizaciones acceden a los datos a través de una consulta o un modelo de aprendizaje automático, todavía están capturando el núcleo de significado allí sin arrojar ninguna información importante.

Graficar ciencia de datos

Graph Data Science se trata de dejar que los datos conectados hablen por sí mismos. Podría estar ejecutando un método no supervisado de algoritmo gráfico para encontrar la señal en el ruido. Según cómo se conectan los datos, estos nodos y conceptos son los más importantes.

También podría basarse en el gráfico de clientes para mostrar cómo interactúa la comunidad de clientes y la información es útil para la segmentación.

Las organizaciones podrían ir un paso más allá haciendo aprendizaje automático supervisado en el gráfico. De esta manera, pueden predecir cómo cambiará el gráfico en el futuro. Graph Data Science permite a las organizaciones aprender de la estructura del gráfico, no solo de las personas con las que están conectadas, sino de todo el gráfico. Predice qué relación se va a formar a continuación. Se trata de pasar de lo que hay que saber para buscar a lo que es importante e inusual para luego predecir el futuro y lo que va a cambiar.

Gráfico de conocimiento en Graph Data Science

La Dra. Maya Natarajan, directora sénior de gráficos de conocimiento de Neo4j cree que los gráficos de conocimiento son inmensamente útiles para que las organizaciones resuelvan sus desafíos comerciales. Ella dice que un gráfico de conocimiento es único debido a la semántica. La semántica es uno de los componentes clave y las ventajas de los gráficos de conocimiento.

La semántica se codifica junto con los datos en el propio gráfico. Así es como los gráficos de conocimiento llevan la inteligencia a los datos y mejoran significativamente su valor. Esencialmente, los gráficos de conocimiento aumentan el valor de los datos a través de la semántica al agregar más contexto.

Los gráficos de conocimiento a menudo se implementan como la primera fase en Graph Data Science. Alicia piensa en un gráfico de conocimiento como un gráfico heterogéneo o un gráfico que tiene diferentes tipos de nodos, como personas, lugares y cosas.

El primer paso para hacer Graph Data Science es tener un gráfico. La gran mayoría de los clientes de Neo4j comienzan con un Knowledge Graph para saber qué información tienen, cómo se relaciona con otros conceptos y cómo se conecta con sus problemas comerciales.

Una vez que construyen un Knowledge Graph, hacer Graph Data Science se trata de descubrir qué problemas están tratando de resolver, qué preguntas quieren hacer y cómo convierten todo lo que saben en predicciones precisas.

Pasar de modelos reactivos a modelos predictivos

Las empresas a menudo comienzan en su fase reactiva. Por ejemplo, las organizaciones solo buscan fraude cuando ya ha ocurrido y descubren quién comete el fraude. Alicia cree que este enfoque es útil pero limitado porque, al final, el objetivo es prevenir el fraude en lugar de atrapar a los estafadores.

Cuando se trata de valor predictivo, significa aprender los tipos de patrones que predicen un resultado determinado. En el futuro, las organizaciones podrán conocer los patrones de ciertas características para derivar predicciones precisas.

Alicia ofrece el ejemplo del modelado predictivo al mencionar una gran compañía farmacéutica global. La empresa cuenta con una historia clínica electrónica. Pudieron decir para cada paciente sobre el que tienen datos, esta es la secuencia de eventos que observan en su viaje de atención médica. Tenían todos los datos conectados en un gráfico.

Lo que les interesa hacer es tomar esos datos y aprender de esa información: ¿quién se parece a alguien que se beneficiará de ciertas intervenciones? ¿Quién se beneficia de este medicamento? ¿Y quién se beneficiaría de este fármaco en el futuro? Entonces saben cómo se ve el patrón gráfico para alguien que se beneficiará de la droga. También pueden encontrar personas con características similares y dar intervenciones tempranas para mejorar los resultados de los pacientes.

Para terminar, Alicia dice que ha usado Neo4j durante más de 10 años. Neo4j es la primera plataforma de datos gráficos que existió. y sin duda alguna, Neo4j fue la primera plataforma Graph Data Science. Además de los sólidos fundamentos de una base de datos, existe una plataforma de ciencia de datos escalable para empresas súper poderosa.

Neo4j ha probado productos en decenas de miles de millones de nodos para asegurarse de que su algoritmo termine, dé la respuesta correcta y sea fácil de usar. Cuando las organizaciones combinan un producto de base de datos maduro de larga data con ciencia de datos innovadora, obtendrán todas las capacidades predictivas combinadas con la capacidad de procesarlas. Neo4j cumple con el estándar de madurez, escalabilidad, velocidad e integridad futura.

Para más información visite https://neo4j.com/product/graph-data-science/

Dejar respuesta

Please enter your comment!
Please enter your name here