Multimediális tartalomban való keresés

A multimediális tartalomban való keresés a nyelvfelismerő egyik legeffektívebb felhasználása. A felvétel szövegének automatikus felismerése és annak indexációja segítségével hozzájut a felvételen szereplő információkhoz, anélkül, hogy végig kellene hallgatnia. Ez hatalmas előny főleg a mostani időkben, amikor több az információ és a felvétel, mint amennyi időt rájuk tudunk szánni. Amennyiben egy ilyen felvételi archívum áll a rendelkezésére, nem kell mindet meghallgatnia, sem a manuális kulcsszavakra hagyatkoznia. Ellenben megtalálhat olyan információt is, mely a felvételen csak mellékesen fordul elő, tehát a kulcsszavas keresés biztosan nem mutatná ki.  

Nyelvi rész

Ez a technológia kombinálja a nyelvfelismerőt a fulltextes kereséssel, mindezt a morfológiai keresővel, esetleg a szinonimaszótárral összekapcsolva. Igény szerint kombinálható a hangkeresővel, így olyan rendszer jön létre, mely nem csak keres a beszédben, hanem beszéddel irányítható is. 

Programmegoldás

Mint talán minden effektív keresőrendszerben, itt is először átfut a jegyzéken az indexáció, ezt követően a létrehozott indexekkel kereshetünk. 

Ezen technológia kulcseleme a beszédfelismerő, amely a hangot szöveggé alakítja át (nem egyértelmű hangok esetén a szöveg sem lehet egyértelmű). Ezután következik az indexáció előtti szövegfeldolgozás (indexképzés), például lemmaképzés a morfológiai kereséshez, esetleg fordítás az indexelés nyelvébe, majd a tényleges indexképzés, melyben a keresőgép a keresési feltételek alapján keres. 

A beszédfelismerő aránylag helyigényes és a teljesítményét úgy kell beállítani, hogy elég gyorsan legyen képes átváltani szöveggé az indexjegyzéket. A szöveg feldolgozásához szükséges idő csak töredéke annak, amire szükség van a normál sebességű lejátszásához. A többi tevékenység lényegesen gyorsabb. A keresésnél korlátozó hatású lehet a lemezről való olvasás gyorsasága. Ezt a legjobban SSD lemezek használatával lehet kivédeni.