Free #Python #MachineLearning Training | Session 11 | Learn #AI for Free

TR, entonces, ¿ cómo voy a grabar? ¿ Puedo grabar la
Vaya a la reunión. Está bien, entonces grabará correctamente. Está bien, está bien, seguro.
con mi computadora portátil, uh, solo una actualización, no debería haber sido, quiero decir, no
me permite iniciar sesión como presentador global de mcal, eso es interesante, entonces, puedes
ver tu pantalla, está bien, perfecto, entonces continuaremos con el clase luego y luego después de
la clase uh, los llamaré, está bien, veamos qué podemos hacer para solucionarlo, seguro, está
bien, adelante chicos, está bien, gracias, está bien, claro, entonces chicos, ¿ cómo lamentan las pequeñas
dificultades técnicas? Creo que perdimos un poco el tiempo, así que
Ya sabes, se conducen solos, así que no están presentes con una hoja de Excel, estos. Bueno, ahora, los datos no estructurados. Bueno, entonces permítanos restringir nuestra.
Conocer categorías iguales donde puede tener sus. imágenes de datos no estructurados es un poco más fácil de manejar porque si sabe que todas las imágenes. estarían hechas de píxeles, entonces cada imagen es un punto de datos tridimensional de rojo, azul,. verde, por lo que una imagen para El ejemplo se representará mediante píxeles o, por ejemplo, el RBG. Ya. sabes, el rango está entre 0 y 256, por lo que una matriz básicamente tridimensional de estos números. será una imagen que todavía está estructurada.Es un poco difícil de extraer. No es muy.

sencillo extraer eso, pero aún así son números, los videos también tienen marcos similares, por lo que los video clips. también se pueden asociar disadvantage números, así que básicamente los marcos de imágenes están en el video clip, pero la. parte difícil Aquí viene es el texto, un texto no se puede asociar. a un número predeterminado, ¿. qué número puedes darle al Ejército? ¿ Qué puedes numerar? ¿ Puedes dárselo a la Marina? Correcto, si digo que el Ejército. es una R es algo, digamos la letra, el número de la enésima letra de los alfabetos de la A a la Z. pero. eso realmente tendrá sentido verdad, no tiene sentido a es el guide alfabeto Zed es el alfabeto 26 Al. no hay lógica detrás de esto alguien ya te lo ha dado y no hay lógica. que Zed sea 26 veces de a o Z es uh Z menos a es 25, no es tan correcto, por lo que la parte difícil. en el análisis de texto entra en escena es que no tienes números asociados al texto, está. bien, entonces la PNL, la primera parte es asociar números o cómo representamos uh texto en forma de vectores,. entonces vectores, si lo harías, si recuerdas, digamos que X e Y estaban allí,. así que digamos que x period la característica de ingresos, Y
es la edad, así que y los ingresos correspondientes a esta edad boy. un vector. Bueno, entonces el ingreso period, digamos, 20 000 y la edad, digamos 26, está bien, y en base a eso,. tienes un vector de características, ¿ cómo representarías un vector de, digamos, el ejército indio? Entonces,. digamos que tienes un documento de noticias
, ¿ verdad? Entonces digamos que el número del. artículo de noticias dice que el crimen en la India ha aumentado en un 26% con respecto al año pasado. La policía. y los tribunales están tratando de idear un método en el que se pueda disminuir el número ahora, ¿ cómo? ¿ Podrías. representar esa información en forma de vectores? Correcto, entonces el proceso que esencialmente hace se. llama incrustaciones de palabras. Bien, ahora, ¿ qué son las incrustaciones de palabras? Las incrustaciones de palabras boy básicamente cada. palabra está asociada a una puntuación. Bien, entonces, por ejemplo, um, digamos que comencemos con. el guide tipo. de incrustación de palabras llamado TF IDF ahora, antes de comenzar con TF IDF, quiero darles una esencia. de cómo procesamos previamente los análisis, ahora probemos trick un documento, está bien, digamos
que un documento. tiene una oración. a la escuela a las 7 a. m. de la mañana, uh, mi padre me deja
en la estación de autobuses, vale, hay otro muelle, digamos, muelle para,. digamos, en eso, tienes a mi amigo, uh, mes es, es un arquitecto, diseña edificios increíbles, vale, ahora hay dos documentos aquí ¿. cómo representarás estos dos documentos en diferentes funciones uh o digamos cómo. representarás este documento como diferente uh? Vector de palabras, está bien, déjame tomar un ejemplo,. tienes Google, ingresa una consulta aquí, así que digamos uh quieres buscar sobre mcal,. entonces escribes mcal uh, cursos ofrecidos en Python, así que, por ejemplo, ingresas esta consulta y Google. tendrá una gran cantidad de documentos, por lo
que habrá muchos documentos en forma de imágenes de texto,. ya sabes, todo tendrá todo tipo.
de datos que Google tendrá derecho, entonces, ¿ cómo. encontrará estas palabras en specific entre tantas? como si ha visto cada vez que Google busca. y completa la búsqueda, le dará estos muchos resultados encontrados entre estos muchos, uh uh entonces,. uno de los 10 resultados que se muestran de uh, sea cual sea el número, entonces hay, quiero. decir, digamos, un número infinito de documentos presentes en la base de datos de Google, ¿ cómo encontrará estos, , lo que. usted llama palabras, y le brindará la mejor búsqueda posible entre uh, el infinito? tiene una base de datos, así que este proceso se llama Ino, lo siento, recuperación de información, está bien,. aún hay dudas aquí. Estoy abierto a preguntas. ¿ Entiendes la. esencia? Lo que estamos tratando de ver. B no, no, estoy seguro. Básicamente,. parece que queremos. para crear una oración que es un significado cuál es el significado.
matemáticamente entonces, por ejemplo, si yo esto es este es un ejemplo de documento ahora um quiero uh.
te pregunté uh digamos qué hago yo, bien, entonces, ¿ qué harás primero? buscarás.
estas palabras en el documento uno obtendrás un resultado negativo luego buscarás estas palabras en el documento dos.
obtendrás un resultado positivo mes lo que hace mes no es una pregunta directa no está presente directamente así que.
tienes que entender el contexto, así que poco a poco llegaremos a cómo sabes que el contexto de tu texto se.
puede interpretar y tus respuestas se pueden derivar, pero hasta una esencia intentas hacer.
coincidir dónde está yo presente y de acuerdo disadvantage eso puedes responder la pregunta.

Bien,.
si fueras Google, me darías el Documento dos como resultado. Bien, si ingresaste qué.
hace yo como consulta, entonces me darás el Documento dos como comentario para mí, así que estaría.
muy feliz porque Obtuve la información de aquí, pero imagina que si hay 100 documentos que.
contienen mes trick el nombre mes y cada documento tiene información diferente,.
por ejemplo, este es uno de los documentos que dice que mesan mes es arquitecto, entonces.
habrá otro documento que dice que mes mide 6 fo de alto, habrá otro otro documento que.
dice que mes es como uh mes ama a su familia, tiene dos hijas, tiene una esposa, así que quiero decir, hay.
cientos de documentos que pueden ser de disadvantage el que contiene la palabra ¿ Cómo se refina eso? ¿ Cómo se.
dice? ¿ Qué hago? ¿ Debo devolver al perro en lugar de todos esos 100 perros? Ese es el.
arte, el arte del procesamiento del lenguaje all-natural, eso es lo que le das inteligencia a las palabras, le.
das inteligencia a tu pregunta para que devuelva los mejores documentos posibles de la grandmother.
cantidad de otros documentos, ¿ está bien? Quiero decir, es comprensible que estas sean cosas.
muy nuevas, um, y es completamente diferente de lo que hemos estado haciendo durante el.
último, ya sabes, fue hace aproximadamente un mes, así que es un poco diferente, pero esencialmente el procesamiento del lenguaje natural.
es el arte de dar inteligencia a las palabras y cómo se les da esa inteligencia.
se U.S.A. en números y el proceso llamado incrustaciones de palabras que veremos a esto, pero ¿.
entiendes este concepto de lo que estamos tratando de hacer aquí? Sí, está bien, está bien, increíble, está bien, entonces ahora, antes de.
pasar a las diapositivas, el proceso de recuperación de información se basa básicamente en.
alguna consulta que estás entregando, algunos documentos que están estrechamente.
relacionados fool la consulta, bien, entonces este es el proceso de la tabla de información, bien ahora,.
cómo comencemos con las incrustaciones de palabras, ¿ qué kid las incrustaciones de palabras?,.
será una característica como Estas boy todas las palabras, incluido el documento uno y el documento dos, así que desde.
I hasta digamos edificios, está bien, entonces todas estas serán características.Bien, ahora cuál es el vector

del documento. uno, por lo que está constituyendo
estas palabras ahora mismo, así que uno uno uno como este y todas las. palabras que provienen del documento dos merecen todos ceros, de manera comparable el documento. dos será 0 0 0 0 0 y uno uno uno uno ahora, obtienes esto para que tu documento uno sea. un vector de 1 coma 1 coma 1 como esto a 0 coma 0 coma 0 documento 2 será un vector. de 0 coma 0 coma 0 1 coma 1 coma 1 bien entonces este es un vector de documento y este es un. vector de documento ahora, por ejemplo, esta es la representación más simple y easy de. una palabra de documento uh, estoy ofertando bien, simplemente, si esa palabra está presente o no, si está. presente en ese documento, signifiqué que con un uno, si no está presente en ese documento,. significo que disadvantage un cero, una forma muy simple de representación.Vale, vale, sí, entonces, por ejemplo,. permítenos darte la analogía en la que estabas haciendo con. tu aprendizaje automático, por ejemplo, tenías tantas observaciones correctas, tantas filas, 100. filas y luego tenías funciones como digamos ingresos altura peso y todas estas cosas,. recuerda, entonces, ¿ cuál fue el porcentaje de una character uno? ¿ Cuál fue el vector de esto? Entonces el ingreso
puede. ser 20 000 la altura puede ser 6 pies peso tal vez 70 jaulas entonces el vector de la personality uno fue 20 000 coma.
6 coma 70 coma bla, bla, bla está bien, de manera comparable, el vector de P2 p2 será 40 000 coma, digamos. 5,5 pies 40 KES así, por lo que
el vector de la persona P2 es 40 000 coma 5,5 coma 40 kg, así que en lugar. de estos números y en lugar de estas características, lo que estamos haciendo es representar P1 como el. documento uno.
correcto y las características como las palabras y en lugar de estos números simplemente.

los estamos marcando si actualmente boy cero o quiero decir si están presentes disadvantage el uno.
¿ Esta representación se siente bien, quiero decir? Crees que es bueno o malo? ¿ Cuáles boy tus vistas aquí?
Cualquier comentario. ¿. Cómo crees que te está ayudando esta representación binaria o es significativa? Sí, es bueno, pero toda la fila ¿ Cómo. crees que uh? ¿ Cómo mencionas que se especifica que dice uno como fila completa P1. Vector completo P1 como uno si no, no, no, P1
solo veo el documento uno entonces, cuál es el documento. uno? Digamos que si te pido 15 P1 disadvantage 55 kg entonces está bien, entonces devolverá uno para. P1 en el documento está bien, no, no, no, entonces lo que te estaba diciendo period una analogía aquí, así que P1. P2 es así, sí, P1 y P2 child así, por ejemplo, si quisieras preguntar. ¿ Cuál es el peso de. P2? Puedes decir 40 kg,

pero aquí no puedes decir
lo que es. Puedes simplemente decir aquí que. si la palabra escuela está presente en el documento uno o está presente en el documento dos o está presente.
en ambos. vale, vale, vale, entonces aquí solo marca si está presente o ausente, las palabras están.
presentes en Word, uh, en el documento o ausentes en el documento, vale, lo tengo, lo tengo, así que no hay ningún.
valiance certain que hayamos asignado, por ejemplo, escuela. no es 70 o la escuela no es 60,.
llegaremos a eso lentamente, pero esta es una representación básica, muy básica, la representación binaria, ya.
Sí, así que estoy de vuelta de todos modos. Ahora, ¿.
entendiste la esencia de lo que intentamos hacer aquí? Si tienes alguna pregunta, si tu pantalla no está.
compartida, lo siento, no podemos ver tu pantalla ahora. Oh, está bien, sí. Bien, entonces podemos seguir adelante, entonces sí, está bien, increíble, ahora tenemos lo que hemos.
visto sobre cómo podemos representar documentos en términos de vectores,.
así que lo que estábamos haciendo period simplemente hacer el vector binario, ya sea que esté presente.
o ausente Ahora, ¿ alguien puede decirme cuál es la desventaja de tener un vector binario? Quiero decir,.
si solo te digo que este documento tiene esta palabra y el otro documento no tiene esta.
palabra, ¿ cómo te ayuda esto o te mantiene como en? una desventaja de, digamos, la.
recuperación de información si quiero, digamos, considerando que estos boy los dos documentos, está bien, ahora entro en.
una consulta, ¿ qué hago?, qué documento aparecerá.Aparecerá el documento

dos porque. buscará, ¿ qué es? no en ninguna parte tampoco está en ningún otro documento. mes mes está en este documento sí tampoco está en ninguno de los documentos entonces mes. surgirá de este documento, así que si ingreso una consulta sobre qué hace mies la computadora. me devolverá el documento dos, lo cual es bueno para todos nuestros propósitos en este momento, es bueno, pero por. ejemplo, si tiene un documento tres que dice que a mí le gustan mucho los chocolates, digamos que tiene. un documento cuatro que dice que a mí le gustan mucho los delicious chocolates. dos, uh, lo siento, dos hijos y vive disadvantage sus padres en este momento, por ejemplo, nuevamente respondo la. pregunta: ¿ qué hace yo? Lo que no está allí en ninguno de los documentos.Vale,.
tampoco está allí. ¿ Está en el documento dos, el documento tres y el documento cuatro

? mi computadora. ahora 2 tres 4 ¿ cómo voy a entender qué hace? no me ha respondido la pregunta. No me ayuda, entonces la desventaja. Cuál es su pasatiempo o quién vive con él? No es nada, no me dice nada,.
así que lo siguiente se llama T IFI DF Matrix.Vale, volvamos a lo mismo.
Bien, ahora todas las palabras que componen. Está bien, entonces, por ejemplo, ahora lo que. Entonces digamos que mi médico es , digamos que Sunil asistió a PML, le.
su trabajo es esencialmente el de un científico de datos, está bien, digamos que tengo otro perro, digamos que a él le encanta viajar, su trabajo ahora es ver cuidadosamente estos dos documentos,. cierto, hay ciertas palabras que child comunes, digamos trabajo de científico de datos,. trabajo correcto, le encanta viajar, le encanta, está bien. ¿ Quién es un científico de datos? Estos dos aparecerán ambos documentos,.
cuál es correcto. Uno está bien, muestra un mensaje. El organizador está experimentando.
dificultades técnicas y se reincorpora. La reunión finalizará en 5 minutos. Oh, creo que esa es tu.
conectividad de red. Supongo que no. recibiendo algún mensaje oh, está bien, lo siento, creo que está bien, lo siento,.
no hay problema, pero el organizador creo que es Shar, así que tal vez esté bien de todos modos, veamos,.
tampoco recibí ningún mensaje de todos modos, así que lo que básicamente hacemos es entienda.
cuáles kid las palabras características del documento que representan bien el documento.
ahora, si digo científico de datos, el científico de datos está presente en ambos documentos, cierto, no es.
una palabra característica de estos documentos, así que, por ejemplo, ya sabe que ambos.
kid científicos de datos.

entonces si ingresas Quién es una ciencia de datos ambos documentos vendrán.
ahora si te pregunto quién ama su trabajo está bien entonces quién ama su trabajo ahí es donde.
tienes que pensar cuáles boy las palabras características del documento ahora déjame explicar esto.
de una mejor manera, está bien, ¿ cómo voy a explicar esto? Por ejemplo, ejecutas una consulta.
en Google. Está bien, escribes una consulta en Google. Entonces consulta es básicamente lo que.
escribes para una búsqueda, así que digamos las mejores películas de 2018. ahora, si veo individualmente, si veo estos.
términos individualmente, las mejores películas de 2018, habrá 100 o miles de documentos que contengan.
la palabra mejor, habrá miles de documentos que contengan la palabra películas, habrá miles.
Entonces la combinación será y. Correcto. Entonces quieres un documento que contenga todas estas palabras. Las mejores películas de 2018.
una combinación de todas estas palabras. tienes que encontrar un documento o tienes que encontrar un archivo que.
contenga todas estas palabras correctamente, por lo que será un y correcto, por lo que debes presentar todas las palabras en.
la consulta deben estar presentes en el documento ahora si encuentras todos estos documentos cómo ¿.
Los clasificará correctamente de modo que habrá, digamos, cientos de documentos que surgirán de esta consulta? ¿.
Cómo los clasificará? ¿ Cuál será la importancia de cada uno de los documentos? De ahí.
viene el término frecuencia. Entonces, si es mejor, la palabra mejor. viene digamos 100 veces aquí solo dos veces.
aquí películas viene digamos 20 veces aquí solo cinco veces aquí así que verás que.
es más potential que el documento uno sea un documento más importante en comparación con el documento 100 porque las apariciones.
de estas palabras child mucho más en el documento uno en comparación disadvantage el documento 100. Estoy abierto a Estaré.
Estoy bien, así que sí, ¿ esta secuencia tiene algún sentido o.
no? Me refiero a lo mismo que puedo escribir como películas de 2018 como las de las mejores personas. Acabo de cambiar.
el significado de la palabra secuencia se puede cambiar correctamente. Muy bien, es una muy buena observación. no hemos llegado a esa incrustación de palabras donde la secuencia también se cuida en este momento. Lo.
primero que comenzamos fue que una sola palabra estará presente a continuación, estamos comenzando disadvantage.
varias palabras que deberían estar presentes ahora estamos viendo que la La importancia debe depender.
del número de apariciones de estas palabras.

5,5 pies 40 KES así, por lo que
el vector de la persona Character es 40 000 coma 5,5 coma 40 kg, así que en lugar. P1 en el documento está bien, no, no, no, entonces lo que te estaba diciendo age una analogía aquí, así que P1. Bien, entonces podemos seguir adelante, entonces sí, está bien, increíble, ahora tenemos lo que hemos.
Entonces digamos que mi médico es um, digamos que Sunil asistió a PML, le. Oh, creo que esa es tu.Usted hizo una excelente observación de que la secuenciación
no está presente aquí en este momento, así que llegaremos a eso, sí, un guide documento B más de Sally
ha aparecido 10 veces, mov cinco veces, está bien en el El segundo documento B ha aparecido cinco veces mov 10
veces correcto, así que solo estoy cambiando las 10 mejores películas, las cinco siguientes cinco y 10, de modo que cuál no
aparecerá primero exactamente, así que ahora mismo, según la lógica, ambos documentos tendrán la
misma importancia porque su puntuación es 15 y aquí Al también es 15, así que ahora mismo vendrán
con lo mismo.No hemos hablado de cómo diferenciar estos documentos hasta ahora, lo que estamos haciendo es simplemente calcular la frecuencia de los términos, ¿ vale? término frecuencia mejor es cinco película es 10 la siguiente es película es cinco mejor es 10 lo siento creo que dije lo mismo película es 10 y mejor es cinco de todos modos y la puntuación complete para estos dos documentos es 15 así que para usted ahora mismo de acuerdo a la lógica de frecuencia de acuerdo disadvantage el término lógica de frecuencia, ambos documentos tienen la misma importancia. ¿ Entiendes esto? Sí o no te sientes cómodo con ello en este momento. No. Este es un concepto basic, simplemente hemos creado una matriz y estamos obteniendo la recuento de las palabras presentes aquí correcto correcto excelente es decir, qué, por ejemplo, ahora mismo cómo se verá tu matx, así que este será Doc uno, doc dos, veamos este, así que todas tus palabras estarán en, acerquemos esto.

pero esa Matriz binaria me ayudará aquí porque en Matriz binaria no llevamos ningún conteo, no, eso es lo que digo, por eso estamos creando una nueva Matriz. Bien, ahora mira lo que hemos hecho. Hemos creado una nueva Matriz. de los documentos doc uno y doc dos y ahora lo que haremos en lugar de simplemente decirme que Sunil está presente como uno. Ahora les diré cuántas veces está presente Sunil, pero aquí para este perro solo está presente una vez que se ha desarrollado el suelo adecuado. solo está presente, así que, por ejemplo, digamos, escribo aquí.Sunil los va a

aplicar en su trabajo. El trabajo de Sunil es esencialmente el de un científico de datos. Entonces, ¿ cuántas veces Sunil está presente tres veces correctamente? ¿ Cuántas veces asistió está presente asistió solo una? tiempo, está bien, PML presente es una vez, de manera comparable, Sharad está presente cuántas veces en el Doc uno está presente cero, por lo que todas las cosas que child del documento dos provenientes de esos documentos son cero ahora, de manera comparable, el documento 2 Sunil está presente, cero asistido es presente asistido uh sí asistido es cero y sharat está presente una vez el científico está presente una vez Creo que uh ama ama ama está presente dos veces vale entonces ama este presente dos veces ahora tu nueva Matrix está de acuerdo disadvantage el término frecuencias no es solo binario uno o cero ahora le está dando el número de veces, así que si hubiera otro documento, digamos el documento tres, donde uh uh digamos está bien, digamos que le encanta.Sunil asistió

a.
PML. Le encantaron los conceptos de PML, así que los va a aplicar en su trabajo. Es un VI esencial de un científico de datos. Recomienda PML a su amigo. Bueno, ahora, ¿ cuántas veces.
ha ocurrido PML? PML ha ocurrido tres veces. Correcto, entonces digamos que la frecuencia de su término PML es.
tres. Ahora digamos ashoke, [__]

Está bien. Esa [__] es de la que no ha hablado. P, digamos que, como.
Supervisor de M, dice quién está más impresionado con PML, así que si escribe esa consulta, quién.
está más impresionado disadvantage PML, entonces la consulta verificará PML en cada uno de los documentos y PML está.
tres veces aquí, pero PM. veces en esta charla, entonces el documento le dirá a Sunil que es o.
digamos que su documento uno es más digno de elogio de PML en comparación con su documento dos, por lo que Ash.
leerá ese documento y dirá: "" Está bien, Sunil se ha beneficiado más del programa en comparación.
con el documento correcto solo por Aquí hay un ejemplo, así que así es como estamos tratando de refinar, por ejemplo,.
si Sharat también hubiera dicho al menos una vez correctamente, aún así mi documento será más valioso.
para preguntar en comparación con hacerlo ahora, también puedes preguntarme cómo conozco a Sunil.

ha colocado PML je je.
También puedo decir que no recomendará PML a su amigo Sunil asiste a PML y no le encantaba PML,.
así que aún no hemos capturado el contexto, solo hemos capturado las palabras y sus importancias, el.
contexto aquí No he capturado, ¿ está bien hasta ahora? Sí, sí, está bien, entonces, ahora todos entendemos qué child las conjunciones o preposiciones. Si hago esta.
frecuencia, significa que las palabras que aparecen más en los documentos serán más importantes,.
pero una palabra como y si estas palabras aparecerán la mayor cantidad de veces en todos los.
documentos, si aparecen en todos los documentos, entonces esa palabra no es importante para.
mí, porque es genérica, se vuelve genérica, por ejemplo, si las desventajas de PML no lo hacen.

considere que.
estamos uh, quiero decir, simplemente olvidemos lo que estamos considerando, no estamos considerando el.
contexto si el contexto no se considera si ambos hubieran dicho PML tres veces Sunil y.
Sharat ambos hubieran enviado PML tres veces y Si Ashoke quiere decir ver quién refiere.
más PML, entonces Ashok no obtendrá la respuesta porque PML es más genérico, se ha vuelto más.
genérico a partir de la capacitación. PML está ocurriendo en todos los documentos, por ejemplo,.
todos los participantes si han hablado sobre PML, está bien, entonces hay cinco participantes, todos.
han hablado sobre PML y sus oraciones tienen PML, por lo que PML se convierte en una palabra genérica y no le.
Todos los candidatos han hablado sobre PML.
quiero esa palabra, que es más genérica, todos, en todas partes, está presente ahora, por ejemplo, Ashoke.
quiere ver quién realmente ha aplicado ese derecho, así que aplicado, puede aparecer en el documento de Sunil.
dos veces, pero puede no estar ocurriendo en otros cuatro candidatos.

aplicar se convierte en una palabra más importante.
una palabra que es característica de un documento pero no está presente en otros documentos vale, entonces, ¿.
cómo representamos eso matemáticamente? término frecuencia vale, dividido por la frecuencia del documento vale,.
término frecuencia dividido por la frecuencia del documento un gran número de term Un número alto de frecuencia de términos.
es bueno, pero si está presente en todos los documentos, entonces no debería ser bueno, así que si digo que esta es.
la puntuación de una palabra, entonces una frecuencia de términos dividida por la frecuencia del documento es la puntuación de una palabra. ahora, si la puntuación de la palabra es alta, eso es alto, esa es la palabra que es importante para mí, si la puntuación.
de la palabra del documento es baja, esa palabra no es importante para mí, está bien, esencialmente, si la frecuencia de mis términos.
¿ Pueden todos ponerse en. Si la frecuencia del término. Está bien, pero solo unas pocas veces.
Excelente, por lo que esa palabra es muy importante para ese documento.
documentos sobre el trabajo, está bien, entonces recientemente la Copa Mundial de fútbol llegó a su fin, así que.
digamos que 100 documentos que contienen el premio mundial de la Copa del Mundo, está bien.

en Google, está bien, por ejemplo, si.
quieres ver el desempeño de Cristiano Ronaldo en la Copa del Mundo, está bien, tal vez solo dos periódicos.
o dos documentos hablaban de Christiano Rando, así que la frecuencia del término Cristiano.
Ronaldo en esos dos documentos es muy alta, pero es muy raro que ocurre en otros documentos, verdad,.
significa que si busca Cristiano Ronaldo, esos dos documentos deberían aparecer en su búsqueda, otros.
documentos no aparecerán porque no tiene tanto a Cristiano Ronaldo, podría tener una.
basic mención o un straightforward elogio sobre su truco, pero esos documentos que tienen a Cristiano.
Ronaldo más veces son documentos que característicamente dicen sobre Cristiano.
Ronaldo, pero si ingresas a la Copa del Mundo Copa del Mundo, cada documento vendrá con 100 documentos,.
por lo que Copa del Mundo no es genérica, se ha convertido en una palabra genérica.

para todos los documentos,.
no es importante, no es una palabra característica de todos los documentos. ¿ Entiendes esto? Entonces, si.
solo piensa, sí, piensa así si una palabra aparece más en un solo documento.
pero no aparece. tantas cosas en los otros documentos significa que esta palabra es realmente importante.
para este documento, este documento realmente habla de esa character, este documento realmente.
me habla de ese concepto, mientras que los otros documentos no me hablan de este concepto.
y también no es una palabra genérica, está bien, así que no, lo siento, pero ¿ qué pasa con el caso en el que Ronaldo,.
asumiendo el primer documento, Ronaldo estaba jugando desde este país en la Copa del Mundo, lo estaba haciendo bien y.
anotó esto, esto, así que aquí en el guide documento, Ronald apareció solo? una vez, pero estoy.
usando el pronombre he para veces, sí, sí, en la otra, no, sí, sí, en el otro documento.Ronaldo puede.

aparecer dos o tres veces, pero no hay él, así que en el guide documento me refieren a Ronaldo muchas veces en.
comparación con el Segundo. documento bien, muy buena pregunta, es una muy buena pregunta, así que mira, mira,.
uh, lo que estamos haciendo aquí está progresando lentamente en cómo dar inteligencia a nuestras palabras, así que.
lo que he dicho es que ahora mismo estamos en un punto en el que solo estamos discutiendo. sobre el término.
frecuencia, poco a poco hablaremos sobre las palabras sin importancia y luego pasaremos lentamente a cómo.
incluir el contexto, así que aquí lo que estás viendo es algo llamado contexto, por lo que en realidad es.
un pronombre de la misma persona disadvantage la que empezamos. con la oración correcta muy lentamente cuando pasamos a.
diferentes procedimientos aplicamos esta inteligencia o también incorporamos esta inteligencia a.
nuestros próximos modelos, pero en este momento solo estamos haciendo un análisis simple y simple, esa es.
una buena pregunta, así que lo que estamos aquí es qué Lo que hacemos aquí se llama análisis de dependencia, por lo que un sustantivo,.
un pronombre o un verbo child en realidad partes de dependencia.Uh, entonces hay

un árbol para que cada sustantivo, pronombre, verbo,.
adverbio tenga un nombre raíz, por lo que, por ejemplo, será partes de dependencia de Ronaldo, entonces.
él también será contado bajo Ronaldo, su dependencia dependerá de Ronaldo, por eso.
se contará bajo Ronaldo, por lo que el paso de dependencia es otro concepto al que llegaremos.
más tarde, ahora no está bien, pero ¿ está claro este concepto? No podemos compartirlo.

tu pantalla debería, sí, yo,.
porque la conservé, uh, creo que se automatiza cada vez que se registra automáticamente, desaparece. Empezaré, ¿.
puedes ver ahora?, sí, está bien, está bien, entonces, entonces, hemos entendido esta parte, el término correcto, frecuencia,.
frecuencia inversa del documento, entonces. de otra manera, si viene un tablero en certain en todos los documentos,.
mantendremos DF IDF por eso significa que para cada documento habrá y perdón por cada documento por.
cada palabra, mantendremos TF DF correcto, así que ahora hemos avanzado aquí. aquí Sunil estaba.
allí sh y todo estaba allí, así que inicialmente lo que estábamos haciendo.
lo manteníamos binario, luego comenzamos con la frecuencia de términos y ahora mantenemos tfid, por lo que la puntuación de.
Sunil en el documento uno ya no es uno o no. La frecuencia a largo plazo ahora es la.
frecuencia del término, la frecuencia inversa del documento, entonces, ¿ es esta la misma métrica que hemos modificado? Tengo razón, sí, la misma.
Ahora introduzcamos otro concepto llamado tokenización. ¿ Qué es la tokenización? La.
tokenización es.
uh iPad. Disfruto tomando clases, así que en Python es esencialmente una oración, pero.
necesito crear para descubrir la frecuencia de los términos. Frecuencia inversa de los documentos. Necesito acceder a cada una.
de las palabras correctamente, así que primero lo que tengo que hacer. hacer es tokenizar, así que seré un token have será un.
token a será un token iPad será un token Ya soy un token ya soy un token disfrutar será un token tomando.
será un token bien, así que básicamente tokenizar cada una de las oraciones, así que, por ejemplo para calcular.
el término frecuencia inversa frecuencia del documento necesitas tener acceso a cada una de las palabras que.
utilizas en ese momento hay algo llamado liati entonces lo que es limiti es.
básicamente si la palabra es tomar tomó tomar uh sí, entonces cada una de las palabras son.
derivadas de toma solo bien estas no son palabras diferentes Al juntas bien así que.
básicamente si he tomado no debería considerar esto como una palabra diferente esto es.
esencialmente lo mismo solo el tiempo pasado con la misma Esencia que T de manera similar tomar es la.
misma esencia de T correcto, entonces limiti significa que siempre vas a la palabra raíz, vale, entonces la.
palabra raíz es St.Está bien, entonces hay algo llamado normalizar, lo que es normalizar, normalizar es,.
EE. UU. Usted sabe que estos son iguales, por lo que Python tiene un diccionario de normalización incorporado.
donde todas las abreviaturas posibles se asignan a cada una de las.
formas completas, por lo que EE. UU. y Estados Unidos de América son iguales, de manera similar, todos los demás abion están.
mapeados en Al. juntos en el Corpus para que las identities cada vez que ejecuten una consulta.
no tengan que mencionar a una character que escribe EE. UU. y Estados Unidos de América deberían recibir la.
misma consulta o el mismo mensaje correctamente, por lo que esto se llama normalización y también los sinónimos, lo.
siento, ¿ podemos? Piénselo como sinónimos o solo para mí cada uh no solo abreviaturas,.
UU.
abreviaturas, así que digamos que el automóvil y la tarjeta están mapeados, un avión.
o un vuelo también están mapeados, así que no es solo aviaciones son palabras generales que.
la gente U.S.A., aparte del diccionario, palabras bien, significan palabras que tienen el mismo significado.
o un significado comparable, correcto, correcto, que no tienen ningún parecido, por lo que avión.
y vuelo no tendrán ninguna semejanza. en términos de cualquier lógica, es lo mismo, es lo que la gente U.S.A..
como vocabulario, así que entonces hay algo llamado um. Bueno, normalización, climatización,.
terización, ahora hay algo llamado palabras vacías. Las palabras vacías son básicamente palabras como y o si, así, por lo tanto, estas child. las palabras que no agregan ninguna información a tu consulta, el.
tipo correcto de preposiciones, ya sabes, solo um, tratando de completar oraciones para que estas palabras.
no agreguen ninguna información in itself a tu consulta um, por lo que estas palabras no las quieres en tu.
término.

frecuencia en la frecuencia inversa del documento Matriz, por lo que la parada rapid eye movement para la eliminación es muy.
importante, así que cuando sea así, esto es así, por lo que todas estas palabras boy amables, todas estas.
cosas boy una especie de pasos de preprocesamiento, como si preprocesáramos nuestros datos. ¿ Cuáles.
child los pasos de preprocesamiento para PNL que primero debes eliminar? Está.
bien, ahora, ¿ deberíamos eliminar las palabras vacías primero y luego lematizar o deberíamos.
lematizar y luego eliminar las palabras comunes o es lo mismo.
primero? lizar y luego eliminar estrellas es sí, ¿ cuál es la razón? si hay algún.
otro significado si los hay, si esas palabras están ahí, como combinar.
palabras de conjunción correctas, así que básicamente las palabras vacías son limitadas. Creo que hay unas 150 palabras.
que child presentes en el diccionario de Python como palabras vacías, por lo que puede haber ciertos casos en los que.
conoces el tiempo pasado, el futuro o algún tiempo de estas palabras, entonces eso puede estar.
presente, así que primero siempre es esencial ir a la palabra raíz y luego elimine las.
palabras vacías para que haya pasos de procesamiento previo no, no está claro, está claro primero y por qué está bien, entonces lo que.
dije es limiti, el límite correcto es, por ejemplo, , digamos, está bien, déjame ver qué ejemplo puedo dar, por ejemplo, sí, entonces, por ejemplo, algunos detener las.
palabras es es está ahí está bien, pero tu oración contiene r r no está aquí ¿ r uh te da alguna.
información sobre uh tu consulta no es correcta normalmente? Además, cuando ingresas la consulta, incluso escribes.
las preposiciones que no escribes correctamente, así que solo escribe palabras aleatorias como efecto PML o lo siento,.
cursos en PML, está bien, muy pocas veces escribes muchas oraciones buenas, ¿ cuáles kid los cursos que.
se ofrecen en PML en línea? Muy pocas veces ingresas la preposición, por eso estas.
cosas no agregan ninguna información.

la consulta o el proceso de extracción, por ejemplo, si alguna.
oración contiene R, primero volvemos a su raíz, la palabra es y luego se eliminará.
mediante palabras vacías, entonces Li, luego, palabras vacías, sí, sí, sí, está bien, así que vamos a hacerlo. usando estas diapositivas, uh, porque kid.
muy intuitivas, ¿ puedes ver mi pantalla? Sí, sí, así que regresemos y veamos qué hemos.
aprendido primero, así que la recuperación de información es encontrar un material, generalmente documentos de.
naturaleza no estructurada, generalmente texto que satisfaga. una necesidad de información.
dentro de grandes colecciones, está bien, entonces, si solo hay dos o tres documentos, entonces puede.
extraerlos manualmente, pero si hay una gran cantidad de documentos o colecciones, entonces necesita.
tener un procedimiento automatizado para hacerlo bien, ya hemos visto lo que es un documento, el documento.
puede ser páginas internet, correo electrónico, libros, noticias, historias, seguimiento, artículos, mensajes, PowerPoint,.
PDF, foro, publicación de pents, sesiones de mensajería instantánea, tweets, preguntas, respuestas, publicación de X, cualquier cosa, así que,.
cuando esencialmente escribes una consulta, tu Google está revisando todas estas cosas, así que quiero decir,.
solo Aprecio ese motor de búsqueda que está haciendo tantas cosas y la gente no se da cuenta de qué es lo que.
está haciendo en segundo plano.Quiero decir,

yo tampoco, hay muchas cosas que.
child muy interesantes en el procesamiento del lenguaje natural, por lo que comprender el contexto.
ahora incluso Si entiendes el contexto, entonces hay algo que se llama.
sarcasmo, por lo que el contexto del sarcasmo es muy difícil de entender, así que llegaremos a.
eso, si tienes tiempo para ello en esta sesión, veremos cómo entiendes el contexto.
en ¿ Cómo se llama recuperación de información en PNL? Está bien, entonces su base de datos puede ser de.
registros bancarios, saldos, nombres, direcciones, números de Seguro Social, fechas de nacimiento, etc,.
pero estos kid principalmente datos estructurados, por lo que los números de cuenta, los saldos necesitan que todos estos sean.
archivos Excel presentes, están en estructura.Datos, es por eso que es muy fácil comparar campos.
con Will certainly Specify scha, por ejemplo, si alguien dice que averigüe la información de este número de cuenta en specific,.
entonces es muy fácil, solo tiene que escribir el número de cuenta y.
solo aparecerá una lista. Lo correcto es una búsqueda simple, por lo que, por ejemplo, si.
busca registros con una tasa de saldo remarkable a 50 000 y simplemente ejecuta una consulta SQL y.
sabe que es muy fácil de hacer, el desafío vendrá, digamos que está bien, no se menciona. aquí, así que.
iremos lentamente hacia el desafío, entonces, ¿ qué es IR? ¿ Cómo hacemos en IR la indexación y Ral de.
documentos textuales? Bien, primero tenemos que indexar, como lo que hemos hecho es la frecuencia de términos inversa, la.
frecuencia de los documentos, lo indexamos.

Bien, ahora mira lo que hemos hecho. Le encantaron los conceptos de PML, así que los va a aplicar en su trabajo. Correcto, entonces digamos que la frecuencia de su término PML es.
Excelente, por lo que esa palabra es muy importante para ese documento. Usted sabe que estos child iguales, por lo que Python tiene un diccionario de normalización incorporado.y luego lo recuperamos bien, así que la primera preocupación es
recuperar los documentos relevantes para una consulta, así que, como dije, no siempre puedes ejecutar uh, devuélveme
mil documentos con mi consulta correctamente, tienes que refinar tu búsqueda, tienes que dar
primero los documentos más importantes y luego los demás documentos, por lo que debería haber una
clasificación en specific, así es como Google funciona, así que hay tantos resultados de búsqueda que
te dan los mejores resultados, para ti, en la primera clasificación, luego viene la segunda.

viene el
tercero, así que tienes que darme las mejores, vale, entonces tenemos uh uh, entonces, por ejemplo, alguien
escribe cuál es la aplicación asesina, está bien, entonces habrá si usas la palabra asesina, entonces
habrá aplicaciones que child destinado a matar, pero la identity que quiso decir esta consulta no pretende
encontrar aplicaciones destinadas a matar, es como buscar las aplicaciones que están revolucionando, quiero
decir, revolucionarias en el sentido correcto, lo cual es realmente apreciado, así que aquí es donde su
comprensión del contexto es muy importante está bien, ahora volvamos a Creo que ya he
contado todas estas cosas también, así que básicamente tu documento Corpus tiene muchos documentos
está ahí tu sistema IR está convirtiendo esos documentos a TF IDF entonces tiene una consulta y.
luego tiene una clasificación.Los documentos siempre recuerdan esto. Está bien, entonces, lo que es relevante. Los. documentos relevantes contienen la información que una persona estaba buscando cuando envió. la consulta. Esto puede incluir estar en el tema adecuado. Debe haber información reciente y oportuna. está. bien tener autoridad de una fuente confiable que satisfaga los objetivos del usuario y. su uso previsto de la información, por lo que esto se entiende por relevancia, lo que hemos hecho es simplemente. abordar el primero sobre el tema adecuado, así que estamos tratando de dar los documentos. que child relevantes para el tema está bien, ahora
vamos, así que haremos una capacitación práctica, ya que. no tengo la conexión de la computadora portátil hoy mañana haremos algo de práctica y les mostraré. en qué se diferencian. extractos, ¿ puedes saber? diferentes consultas pueden cambiar el proceso de recuperación. Está. bien, está bien, entonces todas estas cosas ya te las he dicho, así que mira a la gente de los automóviles. República de China versus. China, así que estos child dos esencialmente lo mismo. Automóvil versus automóvil. Aquí es. donde viene la normalización ni. en la imagen, bien, ahora hay algo que se llama. recuperar el documento irrelevante debido a la ambigüedad, así que Apple ahora, si busca la aplicación, está bien,. entonces, si devolverá la fruta o la empresa, ese es un problema muy difícil o un. desafío difícil para el electric motor de búsqueda, ¿ verdad? Entonces, puedes buscar en Apple y, , te da el. fruto, pero lo que querías decir es ver la compañía Apple y viceversa
también, así que estos boy. los desafíos básicamente que el procesamiento del lenguaje natural intenta abordar mediante el. aprendizaje automático.Entonces, ¿ cómo funcionará el aprendizaje automático? ayuda aquí, cualquier idea basada exactamente en el contexto, así que es una. respuesta perfecta, así que en este momento lo que hemos hecho es una especie de índice de frecuencia de términos de estado.
Yo soy frecuencia de documento inversa,. pero la pregunta que Sunil tenía period correcta: ¿ cómo encontramos el contexto. donde está el La parte de aprendizaje automático vendrá, así que tengan paciencia, llegaremos lentamente a eso, pero.
, ¿ vale?
etcétera, así que volvamos al uh, está bien, volvamos Entonces esto es lo que quería decir disadvantage términos. índices de documentos matrices de incidencia IND esto es básicamente la matriz binaria bin si.
tokenización correcta, estás dividiendo las palabras tan distintas. que cada una de las palabras perderá su.
Francisco es una especie de estado specific, verdad, no child San y Francisco diferentes, verdad, es. San Francisco debe unirse, por lo que todo esto proviene de la parte del aprendizaje automático, por lo que el. San Francisco en Google podría haberle dicho algo, algunos resultados de San y algunos resultados de Francisco.
Google.
está aprendiendo que lo que cada usuario intenta decir es usar correctamente su aprendizaje automático, por lo que aquí es. donde combinamos correctamente la PNL y el aprendizaje automático, de modo que todo lo
que no se puede resolver con. frecuencia de términos, frecuencia inversa de documentos o matrices binarias, se debe realizar el aprendizaje contextual a partir. de aprendizaje automático correcto y cómo lo haremos aprenderemos, le daremos. una introducción sobre cómo hacerlo bien, vale, los números también boy un desafío a veces Chino, ¿. cómo escribimos, lee chino? El chino no tiene espacios en blanco, ¿ cómo se tokenizará? es incluso.
correcto, así que cualquier concept de cómo puedes tokenizarlo primero se traduce al inglés,.
luego podría ser una forma indirecta, pero es básicamente una de las. lógicas que pueden ser como, lentamente, lo que haces es incluso tokenizar el palabra a. letra correctamente
, por lo que cada palabra ahora será una comparación comp.Quiero decir, una combinación de.
Vocabulario en inglés, así que tan pronto como la primera palabra que tiene sentido uh del vocabulario en inglés. No, ¿ puedes hacerlo de nuevo? Está bien, así que.
mira cuando la tokenizamos, somos lo que estamos haciendo.

en inglés se basa en espacios en blanco,.
estamos separando las palabras y bien, así que si la oración es voy.
a la escuela, lo toiz será yo por separado porque había un espacio entre am y.
luego voy a ir y he tenido un espacio entonces escuela así que esencialmente debido a los.
espacios en blanco podría tokenizar las palabras cierto, sí, está bien, pero en chino no hay.
espacios en blanco, ¿ cómo vas a tokenizar? Entonces, ¿ qué harás? Digamos, pensemos.
en una analogía, aquí voy. ir a la escuela es continuo, cierto, entonces, déjame escribirlo.
aquí, déjame dibujarlo aquí para ti, así que digamos que voy a la escuela, es una sola palabra, vale, ¿.
cómo harás esto? Simbólica esto como letras individuales, vale, voy a ir, vale, entonces, ¿ qué.
¿ Tienes sentido según el diccionario de inglés? Luego la separas y comienzas de nuevo.
Tiene sentido?. Tiene sentido en inglés, por lo que obtienes un mistake aquí. Entonces, básicamente,.
has hecho una falta de coincidencia aquí, quiero decir, deberías haber ido disadvantage am, pero como a.
está en el diccionario de inglés, no puedes hacer nada más aquí, entonces comienzas con M,.
por lo que M no tiene ningún sentido. No tiene ningún sentido, entonces comienzas cheat mg. ¿.
Tiene algún sentido? No, no, no tendrá ningún sentido. Así que ir a m, nada tendrá sentido. M se.
reemplazará y luego comienzas trick g. No tiene sentido. No, ir, sí, tiene sentido. así que te.
detendrás aquí, así que hay muchas cosas que lo siento, uh, sería cuando lleguemos a A,.
debería verificar A y M, cierto, sí, debería haberlo hecho, pero la lógica de lo que te estoy diciendo.
Yo y a no nos uniremos históricamente, por eso a será rechazado allí, pero. En este momento lo que.
estaba diciendo dependiendo de las palabras, cada vez que tenga sentido que te detengas, se detendrá aquí, bien, está.
bien, entonces tienes que dar inteligencia del aprendizaje automático de que yo y soy nos uniremos.
y no yo, así que ahí es donde puedes llenar. Esto está bien está bien, está bien, sí, gracias por cualquier pregunta, sí,.
básicamente, está claro cómo buscaremos, pero todavía no puedo entender cómo usar.
el aprendizaje automático en sí, sí, así que porque no estás tratando de resolverlo porque.
Sí, entonces usaremos el aprendizaje automático. No profundizaremos en el aprendizaje Mach, porque con el.
aprendizaje automático. Solo te diré cómo podemos usarlo de todos modos, así que ya hemos visto otros.
casos sin espacios en blanco, de todos modos, estos están bien.Vale, esto

es algo muy importante.
llamado plegado de casos correcto. MIT frente a MIT será diferente, pero.
no debería ser diferente. alimentado correctamente versus alimentado no debería ser diferente, por lo que.
cada letra debe convertirse a letras minúsculas, así que, eh, eso es para.
que tenga sentido para su consulta hacer coincidir las normalización. Hemos visto lo que se.
necesita para normalizar los términos en el texto de índice, así como consulta términos en la.
misma forma, así que, por ejemplo, queremos hacer coincidir U.S.A. y USA, deben ser de.
la misma clase, está bien, entonces ventana, ventana y ventanas detienen las palabras, como hemos visto, los ejemplos kid a.
n r a es ADD B by for kind, por lo que estas child las palabras lo cual no tiene ningún sentido.Di.

un ejemplo de R y está ahí, pero verás, R ya está ahí, por lo que lentamente la gente está.
desarrollando este diccionario St correctamente, pero el concepto aún permanece cuando.
primero usas LTI y luego eliminas. las paradas, entonces LTI, ya hemos visto qué es LTI.
cars vehicles autos todos los cars caerán bajo el derecho de destrucción del auto deben ser destruidos deberíamos.
usar estas lización y palabras de parada en nuestra programación o ya estarán disponibles solo.
para usar la so lización se realizará automáticamente quit también se realizará automáticamente, pero stopwords.
tiene un diccionario, por lo que también puedes actualizar tus palabras quit en de acuerdo con el.
caso de uso correcto, por lo que podrías pensar que, para tu aspecto particular, estas son las palabras que.
no Es importante que puedas actualizar tus palabras de Stu, ahí mismo, estas son las.
palabras de Stu generales en casos genéricos, pero es posible que estés trabajando con algún caso en el que otras.
cosas pueden ser palabras vacías, así que puedes actualizarlas manualmente. Además, no lo hago manualmente,.
puedes estar disponible automáticamente cuando lo usamos en programación, sí, sí, sí, está bien,.
entonces, lo que se deriva es un poco, digamos cómo se llama un enfoque más cuchillo.
para limitar, así que en lugar de saber que hay diferentes, digamos automatizar Automobile automático se reducirá.
a automatizar, está bien, por lo que puede que no tenga sentido, pero es como quitar la palabra raíz de.
esto, la palabra raíz podría no tener sentido, por lo que la raíz normalmente no la use porque,.
si lo está haciendo.

una lematización que resuelva su propósito, no utilice la derivación, pero.
a veces hay casos usados en los que se puede derivar, pero aquí no lo usamos. Está.
bien, la derivación es un proceso heurístico crudo que corta el last de la palabra con la esperanza de.
lograrlo. ¿ Qué principio intenta hacer la nematización disadvantage una gran cantidad de conocimiento lingüístico? Entonces, la.
derivación es un enfoque más ingenuo que en comparación disadvantage la lematización. Está bien, entonces no iremos al algoritmo P. Este es básicamente el algoritmo P de lematización. Está bien, está bien, entonces esto también se hará a continuación.

Ve a.
saltarte sugerencias ¿ Entiendes esto? ¿ Estás encontrando interés en esto? Porque mira, este.
Hay mucho que hacer. Mucho en qué.
pensar. Como dije, nadie sabe todas las respuestas. procesamiento del lenguaje all-natural,.
todo tiene que ser, ya sabes, lo pensé, así que mañana les daré un.
ejemplo del procesamiento del lenguaje natural que hice en mi proyecto y, bueno, déjenme darles una.
introducción al respecto, así que mi empresa tiene mucho. de cuadrados cuadrados correctos significa unidades de mantenimiento en existencia, por lo que Johnson.
Johnson tiene muchos cuadrados cuadrados, digamos que en una región specific de Asia Pacífico podría ser 8000 cuadrados cuadrados correctos, por lo que.
8000 cuadrados cuadrados tendrán cada uno de los cuadrados cuadrados disadvantage descripciones correctas, por lo que las descripciones child como 20.
caras de Neutrogena.

crema, está bien, o aceite para bebés de Johnson'' s 60 G o talco para bebés de Johnson ' s 20 gam, así que.
lo que sucede es que los erps boy base de savia, verdad, savia es una base de datos transaccional primary que tenemos.
ahora, hay una base de datos separada en Europa que tenía unos metros cuadrados de Asia Pacífico, cierto, pero al.
ingresar a esos cuadrados la gente no había mantenido el mismo número, por lo que, por ejemplo, si un material, el mismo.
material tiene un número de digamos 1 0 02, aquí en Europa el mismo material puede tener un número.
completamente diferente, tal vez 5067, ¿ cómo? para hacer coincidir esto solo tienes el número que es.
diferente solo tienes la descripción del material ahora consideras cada uno de los sqs como un.
documento diferente encuentras las palabras características de la matriz tfidf de cada uno de los sqs considerados.
como un documento coincides con estos documentos y descubres la mejor clasificación de documentos de acuerdo disadvantage.
este SQ, por ejemplo, producto Nutrena baby face 20 G.Utilizo esto como mi consulta, mi lista de documentos.
es la excusa en Europa, está bien, trato de hacer coincidir esto disadvantage cada uno de los documentos y luego.
Asia estará en mi consulta. Necesito averiguar el número de product correspondiente en Europa, así que, ¿ qué hago? Mi electric motor de búsqueda ejecutará Essen en todos los materiales en Europa coinciden disadvantage la.
descripción de esta consulta con todos los materiales y me dan la mejor coincidencia posible de esa.
lista. Hice esto y esto ha sido tan bien apreciado que diferentes departamentos me están.
pidiendo que aplique este algoritmo para sus caso de uso certain que es el poder del.
procesamiento del lenguaje natural para muchas de las empresas, quiero decir, después de que sepamos esto, simplemente ingrese a.
sus respectivas empresas y tendrá una panorama diferente de las palabras que antes usaba.
para decir palabras aceptables, cómo.

¿ Sabes cómo usar esos datos? Pero ahora, si aprendes a procesar el lenguaje natural,.
puedes extraer gran parte de ellos solo de las descripciones o solo de las palabras.
de tu negocio, por ejemplo, uno de otros casos de uso en ese ejemplo en certain que Di,.
um, lo que mencionaste es que cada país tiene un número diferente pero tienen la misma.
descripción. Entonces, según la descripción, debes hacer coincidir las correctas, por lo que todas las.
descripciones no serán exactamente iguales, si kid exactamente iguales, entonces puedes usar un Excel. basado en la.
concordancia de palabras, correcto, no es exactamente igual. Hay cierta similitud. Algunos tamaños pueden ser iguales. Algunas.
palabras pueden ser iguales pero no child exactamente iguales. Por ejemplo, Europa puede decir Neutrogena Child Face Powder.
20 G, vale, lo siento, Asia Pacífico dice Talcum powder 20. Bueno, entonces Neutrogena no está ahí, así que tienes que.
emparejarlo y calificarlo y ver si Neutrogena realmente tiene sentido, así que Neutrogena.
es una palabra característica de este documento en particular o es tan genérico en toda la franquicia.
que no lo necesitas.

por ejemplo, si todos los cuadrados kid de Neutrogena, entonces no necesito Neutrogena.
en mi derecho de coincidencia, incluso si Neutrogena no está presente, significa que puedo hacer coincidir el resto.
correctamente, de modo que ahí es donde aparecerá el término frecuencia inversa de coincidencia de frecuencia del documento. ¿.
Incluirá eso oun como significa de búsqueda en EE. Lo siento, no entendí tu pregunta.
estás diciendo? No, eso incluirá como uh, talco para bebés de 20 onzas, sí, sí,.
sí, así que en nosotros las dimensiones de , ya sabes. la medición puede ser diferente en Asia puede ser en.
gramos, por lo que también debes encargarte de todo eso, por lo que cada problema es diferente, a diferencia del.
aprendizaje automático, lo que hemos aprendido de los datos estructurados, usarás estos algoritmos y.
obtendrás lo mejor del lenguaje natural. el procesamiento es muy diferente, tiene que ver los.
datos, debe comprenderlos, lo que tendrá sentido, ya sabe, ajuste su algoritmo según.
Envíame un mensaje diciendo que esto es, ahí, ¿ puedes decirme cómo podemos aprovechar estos datos? Por ejemplo, lo que estamos tratando.
de crear es decir que tengo tantos informes, tantos informes en diferentes bases de datos. Hay diferentes matrices um en los informes, así que, por ejemplo, es muy difícil para mí.
buscar manualmente e ir a cada una de las bases de datos. entonces necesito un chatbot. Quiero decir que el chatbot.
me da el ufr o digamos el informe de precisión de pronóstico para 2017. Me dará, buscará por.
sí solo y me dirá el informe uh, entonces, ¿ cómo buscará?

China, así que estos child dos esencialmente lo mismo. San Francisco debe unirse, por lo que todo esto proviene de la parte del aprendizaje automático, por lo que el. Vocabulario en inglés, así que tan pronto como la primera palabra que tiene sentido uh del vocabulario en inglés. Está bien, así que.
Tiene sentido en inglés, por lo que obtienes un error aquí.Primero convertirá mi voz a text
y luego usage ese texto para buscar los nombres de los archivos y proporcione la mejor coincidencia posible, algo así
como Google um o CD en Apple lo hacen bien, así es como chatot el crawler de chat es básicamente,
podemos usarlo en el texto como lo hacemos Puedo escribir algo y me dará una consulta y.
además convertirá del texto V correcto, ambos correctos, correcto, correcto, correcto, sí, finalmente, en.
segundo plano, si usas estas técnicas de aprendizaje automático, uh, y un algoritmo para darme el.
resultado correcto, es usando el procesamiento del lenguaje all-natural y el aprendizaje automático, no se trata.
solo de usar, así que siempre que haya un formato de texto correcto, todo esto se procesa correctamente.Lo que estamos.

tratando de hacer
como, um TF, lo que dije inicialmente es que estamos convirtiendo las palabras en números correctamente, así que.
primero. tienes que convertir las palabras en números y luego puedes resolver tu problema de aprendizaje automático,.
así que lo que hemos aprendido hoy es cómo convertir palabras en números [Música] una pregunta más,.
, etc. Diferencia de alto nivel entre el aprendizaje automático y luego el lenguaje natural El procesamiento.
o la cosa es que cada vez que hay una estructura, el aprendizaje automático de datos se puede aplicar definitivamente.
y en la mayoría de los casos, pero si hay datos o imágenes no estructurados o alguna voz y otra.
cosa, entonces probablemente la técnica de aprendizaje automático definitivamente no se puede aplicar.

Tenemos que ir a.
esta PNL y uh, estas kid correctas, sí, sí, está bien, está bien, hijo, ¿ tienes alguna pregunta? Básicamente, soy algo que puedo tomar en relación con la PNL porque todavía lo siento,.
no me estoy poniendo bien. Entonces, básicamente, . No estoy con estas cosas, qué otros problemas básicamente,.
así que está bien, así que estoy allí para que tengamos las métricas donde hemos calculado NF IDF, pero después de eso,.
cómo relacionar el aprendizaje automático o lo que sigue después de eso, todavía estoy ahí. porque el.
problema, estos kid los problemas que puedo navegar en Net y puedo resolver, así que estoy.
atascado allí. Quiero ver algo de código, pero todavía estoy luchando con lo que es la PNL en realidad, es.
que en una búsqueda tengo una cadena. Si tengo que buscar algún documento u otra cosa,.
entonces, ¿ cómo procederé y usaré el aprendizaje automático? Entonces, por ejemplo, tomamos el.
ejemplo de cuatro documentos que hemos creado, tres para mí, uno para S, así que a partir de ahí.
podemos escribir alguna consulta y podemos ir paso a paso, entonces, por ejemplo,.
ahora has actually creado documentos como un vector de matrices, correcto, correcto, ahora imagina esos documentos como la fila de.
tu aprendizaje automático y esas palabras como características.Bien, ahora lo que solías. hacer en aprendizaje automático que usaste para formar un modelo basado en las. características que te gustaría predecir si estas boy las palabras cuál. será el resultado vale ahora digamos tu diferente uh digamos tu documento uno digamos tu documento. uno dos tres hay cinco documentos de deportes, seis documentos de entretenimiento, cuatro. documentos de ya sabes, delitos y digamos, 10 documentos de qué más, , programas de televisión,. bien, ahora cada uno de estos documentos, cada una de estas clases ahora pensará en esto como un. problema de agrupamiento o de clasificación. Bien, entonces, por ejemplo, los primeros seis documentos tienen estas. palabras, los valores TF IDF están ahí, está bien y
tienes la clase asociada como entretenimiento, los siguientes. seis documentos tienen las palabras TF IDF, tienes la clase como y um, digamos deportes, está bien,. ahora alguien. te da un documento que conviertes en un TF Ida.Primero sabes que lo que haces es.

formar un modelo a partir de él, de modo que, en función de estos valores tfidf y estas características, entrenas un modelo.
que si mi entrada es así, podemos encontrar el problema de clasificación de clase, sí, ahora.
será correcto y en base a eso, sí, en base a esa clasificación, damos la lista de los.
documentos exactamente, eso es lo que no, pero en ese problema de clasificación todo se ha.
convertido en número, pero solo obtendremos una clase. ¿ No es así, no, no? Entonces, por ejemplo, eso es lo que.
estoy diciendo: cinco documentos boy de entretenimiento, siete documentos boy de, digamos, deportes, 10.
documentos son de películas, ahora obtienes otro documento, ahora tienes que clasificar ese documento, ya.
sea que sea deportivo. películas o entretenimiento Entonces, según la puntuación TF IDF del documento, simplemente.
piense en ese documento como una combinación de características de Creo que no puedo ver su pantalla. ¿ Podría.
compartirlo? Sí, lo dibujaré para usted. Sí, así que básicamente Eso, entendí que se puede.
convertir en un problema de clasificación, así que en el lado izquierdo tenemos los documentos que son iguales a.
una clase, está bien, no, así que veamos el documento uno, el documento dos, el documento 100, este es tu carpus,.
que son las características y aquí tienes TF IDF.Escuelas y esto tienes la clase, así que digamos que.
estos child los deportes, está bien, las películas Cline, está bien, ahora alguien te dice lo mismo, verdad, estas son.
las en tu aprendizaje automático, estas fueron las características y estas fueron las clases, las clases.
eran mucho menores que las filas, así que si Había 100 líneas de pedido,.
había digamos dos o tres clases sobre computer, de manera comparable, hay 100 documentos y.
cada uno de los documentos es, ya sea, películas de deportes o ahora mismo alguien.
te da un documento 101 que tiene las puntuaciones de TF IDF.Tenga este

modelo listo, está bien, use este modelo para predecir en.
qué clase cae su código TF. Me refiero a qué clase, en base a eso.
determinaremos la clase correcta y lo hemos marcado para uno, no para uno que hemos marcado. Bien, este es.
el movimiento CL. Sí, por ejemplo, según los códigos TFS, dirá si se trata de un delito, así que.
sí, hemos calculado el tiempo del delito y lo corrigimos en nuestra Matriz, por lo que ahora alguien.
viene a buscar, uhh, buscar, está bien, así que digamos que se te ocurre un Al realizar.
una búsqueda, se te ocurre una consulta.La consulta también es una especie de documento nuevo, no está tan completo como. un documento normal, pero es una especie de documento. Así que introduces esta consulta en tu modelo,. el modelo lo predecirá en función de este tfidf puntúa cuál es el documento del que está hablando. o cuál es la clase de la que está hablando. Vale, lo siento, no lo entiendo, suponiendo que.
tenemos cuatro documentos. Vea uno porque le hemos proporcionado un texto basado en eso. Podemos crear.
este uno ahora uno para lo que hemos creado y podemos decir que está bien, esto también es para Mt machine discovering,.
por lo que es una clase de aprendizaje automático, así que si estoy dando algunas preguntas, está bien, ¿ qué puedo esperar de.
estos cinco documentos? Uno, dos o tres documentos pueden Supongo que estoy en lo cierto, así que cuando hagas una.
consulta, lo que debes esperar es que el documento más relevante aparezca primero, seguido del siguiente.
relevante seguido del siguiente relevante.Está bien, si estás hablando de Sunil y Sharat, todos. ellos. has aprendido PML y buscas una consulta en PML solo dices a quién le gusta simplemente indicar PML, entonces todos. los documentos aparecerán correctamente para que la computadora no se equivoque. Todos han aprendido PML. No le has dado ninguna otra información para saber cuáles child los dists. diga si quiere decir que le gustó. PML correctamente, de modo que de estas tres personalities a dos personas les guste, según esa consulta, el documento, la. consulta se introducirá en el modelo, el modelo le dirá si les gustó o no, les gustó o. no les gustó. es una clase allí, sí, entiendo, así que se debe realizar supervisión, por ejemplo,. los comentarios de Sunil, por ejemplo, las reseñas de Amazon correctamente, así que Amazon revisa cómo sabes cómo Amazon. extraerá características de tus reseñas, así que, por ejemplo, Seil ha comentado en Amazon que compró. un. iPad le gustó, está bien y le ha dado cinco estrellas.De manera similar, uh Sharat fue a Amazon, compró.

el mismo producto. iPad, es lento, se calienta, así que, tu estrella de citas para él boy solo dos. Van. fue a Amazon y compró un iPad, dice que
es mejor que la ventana de Surface. Microsoft. Surface, le ha dado tres estrellas ahora, siendo una empresa de Apple, lo que. haré es ir a las revisiones, convertirlas todas en tfid.
de Matrix y mantener las calificaciones como valores.
Está bien, mantenga las calificaciones como mi resultado o el resultado y. variable correcto y ejecute un algoritmo y luego veré cuáles kid las características que kid importantes,. C, harás todo lo que estás haciendo en el aprendizaje automático, descubrirás las
. Así que nunca tuviste que hacer.
Ahora los modelos de aprendizaje automático. La forma correcta de no no no recuperar el texto no es, por lo tanto, ver recuperar el documento es. Sí, recuperar el documento es una recuperación de información que es diferente,.
con la consulta, por lo que si ve este Sigma de los términos T es el término que pertenece a la consulta,. documento de intersección de todos los términos que están presentes en la consulta lo siento, están presentes. todos los términos de la consulta que están presentes en el documento, por lo que si su consulta es clases en línea. en PML, solo calificará estas palabras y descubrirá el mejor documento posible, está bien,. presentación del individuo. puntúa bien, así que así es como se verá tu t F IDF Matrix,. así que, por ejemplo, Anthony Brutus, estas son las palabras, uh, así que acaban de hacer una transposición,. hemos hablado de los documentos en el lado izquierdo y las características en la parte superior. documentos en la parte superior y las palabras en la izquierda derecha, así es como se verá su función Vector,. de modo que cada palabra ahora se convierta en un número. Vale, vale, ahora si lo recuerdan. Ahora, si. recuerdan la agrupación ahora. ¿ Qué estábamos haciendo? en la.
agrupación, una parte muy importante es la agrupación de documentos, por ejemplo, ahora mismo.
dije que estos child los documentos que pertenecen a los deportes, estos kid los documentos que pertenecen al.
crimen, estos child los documentos que pertenecen al entretenimiento en este momento, por ejemplo, si quieres.
agrupar Estos documentos que nadie te ha dicho también puedes hacerlo en PNL, así que una vez que hayas.
convertido las palabras en números, será muy fácil para ti convertirlos y utilizar todas las.
técnicas de aprendizaje automático que hemos hecho, así que ahora si estamos haciendo aprendiendo también.
entonces podemos usar el aprendizaje supervisado de la ONU lo único que tenemos que tener en cuenta es.
la medida de distancia que tenemos que seleccionar en la agrupación si recuerdan cuál.
era la matriz de distancia que estábamos seleccionando en la agrupación, ¿ están discutiendo? sobre K, sí, sí,.
significa que estamos dando la K y, en base a eso, somos seleccionados al azar y luego obtenemos.
el promedio hasta que la media que viene no es constante correcto correcto, es decir, algoritmo.
algoritmo estás en lo correcto Estoy preguntando qué fue la distancia Matriz qué age x1- X2 s + y1 - Y2.
Cuadrado recuerda que sí raíz media cuadrática sare tú sí raíz cuadrática media sí entonces uh en lugar de.
esa raíz cuadrática media tenemos que usar la similitud del coseno IND esto o la distancia del coseno así que.
yo No profundizaremos en esto, así que, si ustedes están interesados en la PNL, cuando comencemos.
ese curso, profundizaremos en cuál es la similitud del coseno y cómo podemos.
agrupar los documentos según los parientes.

agrupación, puedes hacer una agrupación por parentesco en los documentos,.
puedes hacer una agrupación jerárquica en los documentos. Está bien, mira si hay dos conceptos,.
solo para darte un ejemplo. Rico, uh, es una característica, pobre, es una característica, está.
bien, digamos clases, según el ángulo. más cerca del ángulo a la.
clase, ahí es donde se agrupa, está bien, entonces todo esto es matemático, no es necesario, está bien, creo que podemos cerrar la PNL por hoy, ustedes tienen alguna pregunta sobre el.
aprendizaje automático, podemos discutir eso, sí, ¿ pueden? envía ese archivo de iPad , sí,.
esto, esta cosa, sí, las notas, sí, te enviaré, te enviaré, simplemente publícalo en lo.
mismo y también la última semana, de la última a la última semana, la conferencia tampoco se publicó allí, sí, el.
problema es que yo Creo que lo que pasó es que el video no se convirtió, así que después de que la reunión.
finalice correctamente, el video clip debería convertirse.El video clip no se convirtió en mi máquina,. así que lo siento ambos días
, sábado y domingo, ambos, sí, sí, sí, así que hubo una actualización. problema en mi computadora portátil, así que hoy después de hoy o mañana publicaré las conferencias.
y las conferencias de esta semana también a medida que sucedan, sí, entonces, ¿ podemos ver el código alrededor de este? en.
algún momento, sí, te lo mostraré, pero el código de aprendizaje automático es no está ahí,.
sí, aprendizaje automático, el código de aprendizaje automático no está ahí, pero la similitud del documento.
TFA word net litier word litier todo está ahí, mi computadora portátil no se abre. Quiero.
decir, no estoy conectado a mi computadora portátil hoy, por eso no puedo mostrarles.
Pídele que te muestre el código. Tengo ese código listo conmigo. Vale, está bien,.
sí, entonces tenías algunas preguntas sobre el aprendizaje automático, así que te pregunté: ¿ Qué boy estas.
métricas de confusión? Bien, una pregunta, otra pregunta, aunque ya hemos cubierto.
básicamente la confianza frente a la precisión.Precisión que es clara,

pero confianza que. no estaba obteniendo al usar ninguna biblioteca, por lo que la segunda cosa, la tercera es que una era aprendizaje automático paramétrico,.
otra es paramétrica no paramétrica, ya que recuerdo el nombre correcto, par correcto, sí,.
parametrización o paramétrica, que eran los enfoques paramétricos y no paramétricos. correcto, entonces estas tres cosas Bally no está clara, está bien, confusión Matrix, creo que pasamos.
media clase explicando eso, creo que sí, lo recuerdo, pero oh sí, está bien, creo que lo.
olvidé, déjame ver si tengo las notas ahí, está bien, confianza y precisión.

Tengo uh, está bien de todos modos, creo que tengo que buscar donde.
No te suena nada de lo que hablamos. Sí, señor, sí, los escucho. Está.
bien, sí, entonces les pregunto, discutimos lo positivo, lo negativo, está bien, no hay problema, pero es.
bueno que lo tengan porque la Matriz de confusión es un concepto muy importante.
y no es así.

Quiero dejar el aprendizaje automático sin aprender esto, está.
bien, déjame dibujar una tabla mejor para que tu modelo de confusión Matrix sea básicamente.
una forma de verificar la precisión de tu modelo de clasificación. Está bien, tenemos Ry para la.
degresión lineal o la degresión per se.

Sí, así que básicamente Eso, entendí que se puede.
Surface, le ha dado tres estrellas ahora, siendo una empresa de Apple, lo que. Así que nunca tuviste que hacer. Sí, recuperar el documento es una recuperación de información que es diferente,. No te suena nada de lo que hablamos.La clasificación también debe tener una
Matriz de precisión, así que la Matriz de confusión es una especie de tabla que se utiliza para
verificar la precisión de su modelo de clasificación predicho positivo, así que digamos que de 100
positivos reales podría predecir 90 correctamente y 10 incorrectos de manera similar.

negativo real 20
negativo podrías predecir cinco correctamente 15 incorrecto esta es tu matriz de confusión entonces esta
es tu verdad real cuántos de ellos realmente fueron positivos y cuántos de realmente fueron
negativos lo predicho es 90 es positivo de 100 podrías predecir 90 positivo uh correctamente
10 los predijiste como negativos de manera similar para los negativos reales podrías predecir cinco
de ellos correctamente 15 15 de ellos los predijiste mal por eso se llaman verdaderos positivos esto se
llama falso negativo esto se llama falso positivo y esto se llama verdadero negativo tiene
sentido cierto positivo significa que ha predicho positivo falso negativo es que lo ha
asignado falsamente a un positivo o negativo falso positivo significa que ha
asignado falsamente un positivo a un negativo verdadero negativo significa que es cierto realmente ha asignado
un negativo a un negativo por lo que su precisión general ¿ Cuántos has
clasificado correctamente? ¿ Cuántos has clasificado incorrectamente del total amount? Lo
siento, ¿ cuántos se han clasificado correctamente del total amount? ¿ Tiene sentido? Bueno,
solo una cosa, entonces esta primera fila, segunda columna, sí, positivo real significa que debería
vienen en alguna categoría X, suponiendo que, pero no estamos predichos en esa categoría, es correcto, no,
por ejemplo, asuma esto como una clasificación binaria, en primer lugar, clasificación binaria, digamos que
está prediciendo sí, no o alto bajo, correcto, así que de 100 alto, usted has asignado 90 de ellos has
asignado alto pero 10 de ellos has predicho como bajo has predicho como bajo pero
Visualize una base de datos en la que tiene que predecir quién está incumpliendo en una tarjeta de crédito. Quiero predecir a las identities que están incumpliendo. Así que aquí.
95 positivos reales del NE, has predicho 95 excelentes positivos.
de 5. También predijiste cinco correctos positivos, lo cual es totalmente incorrecto,. por lo que tu precisión general seguirá siendo del 95% porque 95+ 0 dividido.
por 100, pero ¿ qué? será tu especificidad, está bien, déjame. indicar esto para que lo
entiendas mejor, sí, cuál será tu. especificidad, solo mira
la fórmula y dollar, esta es la forma 95, sí,. 95, la primera especificidad, penny, será
95, sí, 0 por 95, será cero, correcto, cero,.
tú.

tengo que ver la fórmula, sí, lo siento TP estaba buscando TM, es decir, sí, así que la.
especificidad es cero absolutamente cero ¿ cuál es tu sensibilidad 95 95 % 100 % uno en el que eres muy bueno uno en el que eres.
absolutamente malo entonces necesitas una combinación de Estos factores le dan una mejor.
puntuación, por lo que la puntuación F es la media armónica de sensibilidad y especificidad. ¿ Qué significa la armónica? ¿ Cuál sería la respuesta a esto? No se puede determinar correctamente porque uno por sí,.
entonces esto es una especie de infinito y esto es. una especie de cero, por lo que F scod no te permitirá ir a.
uno. Quiero decir que eres mejor en una cosa y puedes ser cero en una cosa que no te permite, digamos.
que es 01, ¿ cuál será el valor aproximado de esto? entonces esto Estará muy, muy cerca de cero. Puedes simplemente calcular que estará muy cerca de cero.Digamos que si

quieres verificar 1 por.
100 es 01 más 1 por esto es 100, entonces 1 por 100 01, correcto, entonces será 0. 01 lo siento, 0.01, entonces 0.01 es.
tu precisión, por lo que incluso si uno es 100%, el otro es 0%, tu puntaje actual F será 01, por lo que.
tendrás que ser muy bueno en ambos solo cuando ambos sean 100 entonces obtendrás tu 100. % de precisión,.
así que si alguien te pregunta cuál es la mejor métrica para, ya sabes, medir tu.
problema de clasificación, siempre debes decir puntuación F, vale, sí, eso es genial, Su, eres.
realmente muy bueno, no, no hay problema, este es un tema muy básico, no hay problema, vale, ,.
otro.

Respondí a tu pregunta que tenías clase intervalo de confianza versus precisión.
correcto, sí, está bien, entonces, para lo que querías verificar el intervalo de confianza, dijiste.
que no podía verificar el intervalo de confianza, no, eso period confianza versus precisión,.
así que precisión. Estaba haciendo un ejemplo allí, decía Bueno, 98% de precisión, obtuve la respuesta correcta,.
pero no pude obtener la confianza. Bueno, ¿ cuánta confianza no me estaba dando? Bueno, normalmente,.
todos los algoritmos están diseñados para operar en un intervalo de confianza del 95%, por lo que, por ejemplo,.
todos los algoritmos están pre - Diseñado para operar sobre la base de un intervalo de confianza del 95%,.
de modo que siempre que tenga ese objeto de árbol de decisión o si profundiza en.
estos parámetros, encontrará el intervalo de confianza y, si no lo encuentra, entonces es, si.
ese objeto no encuentra, entonces ese objeto no está dividiendo estadísticamente los datos que está dividiendo.
sobre la base de la probabilidad, por lo que puede suceder que todos los objetos no den un.
intervalo de confianza, por ejemplo, la regresión lineal definitivamente le dará una confianza.

intervalo porque.
depende de la media y la varianza y supone una distribución de los parámetros, pero un.
árbol de decisión no tendrá el parámetro correcto, es un enfoque no paramétrico, por lo que si es como dije,.
si un modelo es un proceso, es una regresión lineal. un modelo de parámetros Y es igual a Beta más.
beta 1 X más beta 2x pero un árbol de decisión no está parametrizado correctamente no tiene parámetros.
como beta 1 beta 2 es un proceso en el que viene una prueba certain, fluye a través de los árboles y la.
salida se da correctamente, por lo que es un proceso, por lo que si no tiene parámetros, no tendrá.
los intervalos de confianza asociados disadvantage ellos. Está bien, cada modelo no le dará un.
intervalo de confianza, pero en basic, cada modelo lo hará, cualquiera que sea el que suponga.
un La distribución de parámetros funcionará según un intervalo de confianza del 95 %.

Vale, ¿ cuál.
fue tu tercera pregunta? Paramétrico versus no paramétrico. Paramétrico y no the same level. Creo que.
ya lo he explicado hace un momento. Paramétrico es el modelo que tiene una forma de ecuación. ¿ Puedes.
decirme la ecuación? de una regresión lineal sí puedes decírmelo por las pendientes y los signos.
puedes decirme que esta es la ecuación de yal a Beta más beta 1 X más beta 2 X2 está bien, ¿.
puedes decirme la ecuación de un árbol de decisión no no porque no da una ecuación, es un.
proceso, es algo aleatorio. El bosque también es un proceso. K neers también es un proceso, no hay ninguna.
ecuación en particular asociada disadvantage él, está bien, entonces eso no tiene parámetros, está bien, gracias,.
muchas gracias, está bien, no.

problema en absoluto, entonces, cualquier otra pregunta, entonces, ¿ qué están básicamente relacionados? Mañana cubriremos temas importantes sobre el aprendizaje profundo, entonces, ¿ qué vamos a cubrir.
mañana? Mañana cubriremos aspectos muy básicos del aprendizaje profundo, por qué el aprendizaje profundo, cuáles kid las.
ventajas del aprendizaje profundo. sobre el aprendizaje automático y cuáles child los diferentes algoritmos que.
puedes ver en el aprendizaje D, un enfoque muy básico, sí, diferentes, al menos diferentes algoritmos,.
no profundizaremos, sino por nombre o disadvantage algunas definiciones, sí, solo por nombre,.
no profundizaremos, eh.

Debido a que cada uno de los algoritmos tomará una clase diferente, entonces, el algoritmo,.
así que simplemente tomemos sus comentarios. ¿ Quieren entrar en el aprendizaje profundo y la.
PNL como un curso diferente? Solo les pregunto, así que no en PNL pero Definitivamente estaré interesado.
¿ Por qué entonces? No lo sé, pero no, no, eh. Estoy preguntando sobre otros.Sí, estoy

interesado en la PNL.
aprendizaje profundo o algo así, como dije, me refiero a la PNL, puedes aprender independientemente del aprendizaje profundo, pero eso.
no será más, no será de mucha utilidad para ti porque, eh, la PNL y para obtener lo mejor.
de la PNL tienes que entrar. aprendizaje profundo está bien, está bien, entonces probablemente si están interesados,.
digamos que ese period mi objetivo specific para la pregunta, digamos,.
por ejemplo, que están interesados en LP Sunil está interesado en el aprendizaje profundo y digamos que.
otro tipo está interesado. en ambos, así que tal vez pueda hablar con ashoke y tener un curso integrado para.
que se enseñen ambas cosas y, por ejemplo, tres clases tenemos PNL con aprendizaje profundo, es.
decir, tres clases, primero tenemos aprendizaje profundo o cosas normales de aprendizaje automático y luego tres.

En.
otras clases tenemos PNL y aprendizaje profundo o, si quieren, podemos tener una cosa disadvantage.
PNL y aprendizaje profundo separados y luego un aprendizaje profundo separado que también podemos tener, pero eso lo.
tendré que discutir para el programa, entonces, ¿ qué pasa? Fue quien respondió a Sunil después de eso quien respondió.
Yo, no pude reconocer, sí, ¿ qué pasa disadvantage tu momento? Me gustaría tu concepto de trabajo, así que está bien, está bien, está.
bien, genial, también creo que es una buena opción hacerlo, por ejemplo, uh, si tienes más.
práctica. y aprender más sobre el aprendizaje automático primero y luego puedes continuar con el aprendizaje profundo,.
esa también es una buena decisión, así que déjame hablar con ashoke, así que te gustaría tener PNL.No.

quiero profundizar mucho en el aprendizaje profundo, pero tal vez tú, si vas, Tom, si ves mañana y tal vez tu.
interés pueda cambiar, veamos, sí, tienes razón, sí, lo decidiré mañana, sí, pero creo que el.
aprendizaje profundo es más importante en comparación con la PNL, porque la PNL sigue siendo un campo de mayor investigación. la gente.
todavía está tratando de obtener el mejor extracto de él, eh, pero el aprendizaje profundo está poco maduro ahora,.
por lo que ahora que ha aprendido el aprendizaje automático correctamente, el aprendizaje profundo tendrá más sentido para.
aplicarse a los datos de la estructura y obtener lo mejor. y luego, por ejemplo, impulsar.
y todo lo que hayas hecho, el aprendizaje profundo es otro paso por delante del impulso en algunos casos,.
no diría en todos los casos, pero sí en algunos casos, y si combinas PNL y aprendizaje profundo, quiero decir que es.
simplemente una palabra diferente, puedes hacer maravillas fool ella, así que de todos modos eso es algo que podemos discutir,.
pregunta de generación back, por lo que la PNL está más relacionada disadvantage los datos, cierto, está más relacionada con el procesamiento de datos y.
luego el aprendizaje profundo es el algoritmo, sí, así que, por ejemplo, lo que vimos.

en la definición de PNL.
hoy en día, así que lo que vimos es síntesis y análisis, por lo que la síntesis es el área más compleja de PNL, así que.
en datos estructurados que no conoces, no es necesario sintetizar los datos mucho, así que.
ya tienes la datos en un formato estructurado, solo necesita limpiar un poco y luego puede.
aplicar sus modelos, pero en PNL su estructuración y síntesis kid muy importantes, así que una vez que lo tenga.
listo, sus algoritmos pueden funcionar, pero si su estructuración y síntesis boy incorrectas, entonces Dios lo.
hará. No puedo guardar el modelo correctamente, así que quiero decir que el aprendizaje profundo es muy pequeño delante de él, por lo que el.
procesamiento del lenguaje natural muchas cosas van a la parte de síntesis, cómo hacer que sus datos sean.
más significativos, por ejemplo, cómo extraer el contexto fuera de uh, tu extracción de contexto.
se llama algo llamado palabra.Hay un modelo

que emplea aprendizaje profundo e intenta.
sintetizar el procesamiento del lenguaje all-natural y obtener el contexto correcto de las oraciones, por lo que el aprendizaje profundo.
es una parte esencial donde el aprendizaje profundo también se utiliza para sintetizar. procesamiento del lenguaje natural, así que está.
muy mezclado, no kid dos entidades separadas, está mezclado, pero el procesamiento del lenguaje natural.
en su conjunto es la síntesis de datos de texto, eso responde a tu pregunta, sí, está bien, entonces cerraremos por hoy,.
entonces creo que mañana.

es la última clase, así que definitivamente extrañaré estas horas que.
pasamos juntos aprendiendo y ya sabes, discutiendo tantas cosas, espero con ansias que.
tengas más interacciones, mañana será la última clase,.
veamos, uh, creo que todo terminará es una buena nota vale, sí, eso debería ser.
bueno, gracias, gracias, buenas noches, muchas gracias, sí, buenas noches a todos, adiós,.
buenas noches, buenos días, de hecho, sí, adiós, sí, esto.

Envision una base de datos en la que tiene que predecir quién está incumpliendo en una tarjeta de crédito. Quiero predecir a las personas que están incumpliendo. Así que aquí. Quiero decir que eres mejor en una cosa y puedes ser cero en una cosa que no te permite, digamos.
Paramétrico es el modelo que tiene una forma de ecuación.

As found on YouTube

Más noticias de Cristiano Ronaldo

Subir