Q:
Hvad er forskellen mellem tale til tekst og chatbots?
EN:De mange markante forskelle mellem tale-til-tekst-teknologier og chatbots er en del af det, der undersøges i den hurtige udvikling af chatbot- og voicebot-projekter.
En tale-til-tekst teknologi er simpelthen en, der konverterer verbal tale til tekst på en digital side. Det er dens fulde funktion, men det er ikke en, der er enkel at designe. For at konvertere verbal tale til tekst skal teknologien opdele ord og sætninger i individuelle fonemer og arbejde med dem i henhold til komplekse algoritmer for at skabe tekst, der er nøjagtig og repræsenterer, hvad taleren sagde.
Chatbots er på den anden side teknologier, der når målet om at kommunikere med et menneske. Der er to typer chatbots: tekstchatbots og voicebots. Tekstchatbots har eksisteret meget længere, fordi de ikke har brug for det tale-til-tekstelement, som voicebots bruger.
Den største forskel mellem tale-til-tekst-teknologier og chatbots er omfanget. Som nævnt er al den tale-til-tekst teknologi, der skal gøres, at transkribe den verbale tale. Chatbotten på den anden side er nødt til at tale i hvilken form den er lavet til, forstå det og give svar, der prøver at bestå Turing-testen - testen om en teknologi kan narre et menneske til at tro, at han eller hun er taler med en anden person.
Med det i tankerne er chatbots langt lettere at oprette end voicebots. Chatbotten indtager menneskets tekst og giver et tekstsvar. Selv relativt enkle chatbots har været i stand til at give interessante og behagelige resultater for mennesker siden slutningen af 1980'erne og begyndelsen af 1990'erne.
Voicebot skal derimod indtage mundtlig tale, konvertere den til tekst, kontrollere den for nøjagtighed, producere et svar og opbygge dette svar fra maskinsprog til hørbar tale. Dette store antal temmelig betydningsfulde opgaver betyder, at voicebot tager en masse computerkraft og en masse design at opbygge.
Projekter som Siri, Cortana og Alexa demonstrerer en del af fortroppen af voicebot-teknologier. De illustrerer også, at denne teknologi stadig er i sin barndom. Selvom Alexa og andre teknologier kan svare mundtligt på menneskelig tale, er de ikke yderst dygtige i den forstand, at vi forbinder med verbal menneskelig tale generelt. Med andre ord er der en vis begrænsning af de svar, disse teknologier kan give. Der er endda en begrænset mulighed for dagens generation af personlige assistenter til virkelig at generere tale til tekst, for eksempel med det formål at transkribe en e-mail eller hjælpe nogen med at skrive et essay uden at bruge deres hænder. Nogle af de specifikke tale-til-tekst-programmer på markedet gør dette bedre end Siri eller Cortana, sandsynligvis på grund af ressourcetildelingen. Der er dog tegn på, at fremskridt med voicebot snart vil begynde - f.eks. Amazons Lex-platform, der giver et studiomiljø mulighed for at opbygge disse typer teknologier.
I et smart og lærerigt essay om dette emne taler Tobias Goebel om forskellen mellem disse teknologier og kontrasterer processen med at "transkribe", som tale til tekst gør, til jobbet med at forstå, som chatbots skal udføre.
”Selvom det at eliminere behovet for talegenkendelse gør det lettere for en chatbot, er den største udfordring at opbygge fungerende bots i naturlig sprogforståelse, ” skriver Goebel.
Goebel identificerer også mange af de nuværende aktører i branchen:
Markedslederen for talegenkendelse er Nuance, der står bag velkendte systemer som Dragon NaturallySpeaking for diktering på en pc, der har eksisteret siden 90'erne, men også Siri: taleegenkendelses- / transkription opgaven udført i Apple sky bruger Nuance teknologi bag kulisserne. Andre er LumenVox, Verbio eller Interaction, men talegenkendelse tilbydes nu også som en cloud-service via API'er af lignende som Amazon, Google, Microsoft og IBM.
Når chatbots udvikler sig, antages det, at deres forståelse vil fortsætte med at stige på en eller anden bane - og det antages også i vid udstrækning, at mere bot-teknologi vil gå fra tekstgrænseflader til verbale grænseflader, hvilket kræver yderligere mængder computerkraft.