Página principal » cómo » Alexa, Siri y Google no entienden una palabra que dices

    Alexa, Siri y Google no entienden una palabra que dices

    Amazonas

    Asistentes de voz como Alexa, Google Assistant y Siri han avanzado mucho en los últimos años. Pero, a pesar de todas sus mejoras, una cosa las detiene: no te entienden. Confían demasiado en comandos de voz específicos.

    Reconocimiento de voz es sólo un truco de magia

    Amazonas

    Los asistentes de voz no te entienden. En realidad no, de todos modos. Cuando hablas con Google Home o Amazon Echo, esencialmente convierte tus palabras en una cadena de texto y luego las compara con los comandos esperados. Si encuentra una coincidencia exacta, entonces sigue un conjunto de instrucciones. Si no lo hace, busca una alternativa de qué hacer en función de la información que tiene, y si eso no funciona, aparece un mensaje de error como "Lo siento, pero no sé eso . ”Es poco más que un juego de magia con las manos para engañarlo y hacerle creer que entiende..

    No puede usar pistas contextuales para hacer la mejor conjetura, o incluso utilizar un entendimiento de temas similares para informar sus decisiones. No es difícil hacer tropezar a los asistentes de voz tampoco. Si bien puede preguntarle a Alexa "¿Trabaja para la NSA?" Y obtener una respuesta, si pregunta "¿Es usted una parte secreta de la NSA?", Obtiene una respuesta de "No conozco esa" (al menos en el momento de este escrito).

    Los humanos, que realmente entienden el habla, no funcionan así. Supongamos que le preguntas a un humano: “¿Qué es esa klarvain en el cielo? El que está arqueado y lleno de colores a rayas como el rojo, el naranja, el amarillo y el azul. "A pesar de que klarvain es una palabra inventada, la persona a quien le preguntaste probablemente podría deducir del contexto que estás describiendo un arco iris..

    Si bien puede argumentar que un humano está convirtiendo el discurso en ideas, un humano puede aplicar el conocimiento y la comprensión para concluir una respuesta. Si le pregunta a un humano si trabaja en secreto para la NSA, le dará una respuesta de sí o no, incluso si esa respuesta es una mentira. Un humano no diría "No lo sé" a una pregunta como esa. Que los humanos pueden mentir es algo que viene con una comprensión real..

    Los asistentes de voz no pueden ir más allá de su programación

    Los asistentes de voz están limitados en última instancia a los parámetros esperados programados, y vagar fuera de ellos romperá el proceso. Ese hecho muestra cuándo entran en juego los dispositivos de terceros. Por lo general, el comando para interactuar con ellos es muy difícil de manejar, lo que equivale a "decirle al fabricante del dispositivo que dirija un argumento opcional". Un ejemplo exacto sería: "Dígale a Whirlpool que detenga la secadora". La habilidad controla algunos hornos GE. Un usuario de la habilidad debe recordar "decirle a Ginebra", no "decirle a GE" y luego al resto del comando. Y aunque puede pedirle que precaliente el horno a 350 grados, no puede continuar con una solicitud para aumentar la temperatura en otros 50 grados. Un humano podría seguir estas peticiones aunque.

    Amazon y Google han trabajado muy duro para superar estos obstáculos, y se nota. Donde una vez tuvo que seguir la secuencia anterior para controlar una cerradura inteligente, ahora puede decir "bloquear la puerta frontal" en su lugar. Alexa solía confundirse con "cuéntame un chiste de perro", pero pídelo hoy y funcionará. Han agregado variaciones a los comandos que usa, pero en última instancia, aún tiene que saber el comando correcto para decir. Necesitas usar la sintaxis correcta, en el orden correcto.

    Y si crees que suena mucho como una línea de comando, no te equivocas.

    Asistentes de voz son una línea de comandos de lujo

    Una línea de comando se define de forma limitada para realizar tareas simples, pero solo si conoce la sintaxis correcta. Si se sale de la sintaxis correcta y escribe dyr en lugar de dir, entonces el símbolo del sistema le mostrará un mensaje de error. Puede usar alias para comandos más fáciles de recordar, pero tiene una idea de qué eran los comandos originales, cómo funcionan y cómo usar los alias de manera eficiente. Si no te tomas el tiempo para aprender los detalles de la línea de comandos, no te sacarás mucho de ella..

    Los asistentes de voz no son diferentes. Necesita saber la forma correcta de decir un comando o hacer una pregunta. Y necesita saber cómo configurar grupos para Google y Alexa, por qué es esencial agrupar sus dispositivos y cómo nombrarlos. Si no sigue estos pasos necesarios, sentirá la frustración de pedirle a su asistente de voz que desactive el estudio solo para que se le pregunte, "qué estudio" debe desactivarse.

    Incluso cuando utiliza la sintaxis correcta en el orden correcto, el proceso puede fallar. Ya sea con la respuesta incorrecta emitida o un resultado sorprendente. Dos casas de Google en la misma casa pueden indicar el clima para ubicaciones ligeramente diferentes, aunque tengan acceso a la misma información de cuenta de usuario y conexión a Internet..

    En el ejemplo anterior, se da el comando "Configurar un temporizador para media hora". El concentrador de Google Home creó un temporizador llamado "Hora" y luego preguntó cuánto debería durar el temporizador. Y sin embargo, repetir el mismo comando otras tres veces funcionó correctamente y creó un temporizador de 30 minutos. El uso del comando "Configurar un temporizador para 30 minutos" funciona correctamente de manera más consistente.

    Mientras que hablar con un Google Home o Echo puede ser más fluido, los asistentes de voz y las líneas de comando bajo el capó funcionan de la misma manera. Es posible que no necesite aprender un nuevo idioma, pero necesita aprender un nuevo dialecto.

    La comprensión limitada de los asistentes de voz limitará el crecimiento

    Nada de esto impide que los asistentes de voz como Google Assistant y Alexa funcionen lo suficientemente bien (aunque Cortana es una historia diferente). Google Assistant y Alexa buscan búsquedas decentemente en línea, aunque no es sorprendente que Google sea mejor en la búsqueda y pueda responder preguntas básicas como conversiones de medidas y matemáticas simples. Con una configuración correcta de la casa inteligente y un usuario bien entrenado, la mayoría de los comandos de la casa inteligente funcionarán según lo previsto. Pero esto vino a través del trabajo y el esfuerzo, no la comprensión intelectual..

    Los temporizadores y las alarmas solían ser simplistas. Con el tiempo, se agregó la asignación de nombres, luego la capacidad de agregar tiempo a un temporizador. Pasaron de lo simplista a lo más complicado. Los asistentes de voz pueden responder más preguntas y cada día trae nuevas habilidades y características. Pero eso no es un producto del crecimiento propio que proviene del aprendizaje y la comprensión..

    Y nada de eso ofrece la capacidad inherente de usar lo que se sabe para alcanzar lo desconocido. Para cada comando y pregunta que funcione, siempre habrá tres que no lo hagan. Sin un gran avance en A.I. que otorga una capacidad de comprensión similar a la humana, los asistentes de voz no son asistentes en absoluto. Solo son líneas de comando de voz: útiles en el escenario correcto, pero limitadas a los escenarios en los que han sido programadas para comprender..

    En otras palabras: las máquinas están aprendiendo cosas, pero no pueden entenderlas..