Какво е разпознаване на реч?

Използване на вашия глас като метод за въвеждане

Речта за разпознаване е технология, която позволява говорене в системите. Разговаряте с компютъра, телефона или устройството си и използва това, което сте казали като вход, за да задействате някои действия. Технологията се използва за заместване на други методи за въвеждане, като натискане, кликване или избор по други начини. Това е средство, което прави устройствата и софтуера по-лесни за употреба и повишават производителността.

Има много приложения и области, в които се използва разпознаване на говор, включително военните, като помощ за хора с увреждания (представете си човек с осакатени или не ръце или пръсти), в медицинската област, в роботиката и т.н. В близко бъдеще, почти всеки ще бъде изложен на разпознаване на реч поради разпространението му сред обикновени устройства като компютри и мобилни телефони.

Някои смартфони правят интересното използване на разпознаването на говор. Устройствата iPhone и Android са примери за това. Чрез тях можете да инициирате обаждане до контакт, като просто получите инструкции като "Call office". Могат да се забавляват и други команди, като "Включване на Bluetooth".

Проблеми с разпознаването на реч

Речта за разпознаване, в своята версия, известна като Реч към текст (STT), също е използвана от дълго време за превод на произнесени думи в текст. "Ти говориш, типи", както би казала ViaVoice на кутията си. Но има един проблем със STT, както го знаем. Повече от 10 години назад, аз се опитах ViaVoice и не издържа една седмица на моя компютър. Защо? Това беше грубо неточно и аз в крайна сметка прекарах повече време и енергия в говорене и поправяне, отколкото да напиша всичко. ViaVoice е един от най-добрите в индустрията, така че представете си останалото. Технологията е узряла и подобрена, но речта към текста все още кара хората да задават въпроси. Едно от основните му затруднения е огромните различия между хората при произнасянето на думи.

Не всички езици се предполагат в разпознаване на говор, а тези, които правят, често не се поддържат, както и английски. В резултат на това повечето устройства, които изпълняват софтуера за разпознаване на реч, разумно изпълняват само английски.

Набор от хардуерни изисквания прави разпознаването на говор трудно да се използва в определени случаи. Нуждаете се от микрофон, който е достатъчно интелигентен, за да филтрира фоновия шум, но същевременно достатъчно мощен, за да улови глас естествено.

Говорейки за фоновия шум, той може да доведе до неуспех на цялата система. В резултат на това разпознаването на говор е неуспешно в много случаи поради шумове, които са извън контрола на потребителя.

Речта за разпознаване се оказва по-добра като метод за въвеждане на нови телефони и комуникационни технологии като VoIP, отколкото като инструмент за производителност за масово въвеждане на текст.

Приложения за разпознаване на реч

Технологията придобива популярност в много области и е била успешна в следното:

- Управление на устройството. Само да кажете "OK Google" на телефон с Android създава система, която е изцяло ушите на гласовите ви команди.

- Автомобилни Bluetooth системи. Много автомобили са снабдени със система, която свързва неговия радиомотор с вашия смартфон чрез Bluetooth. След това можете да осъществявате и приемате повиквания, без да докосвате смартфона си, и дори можете да набирате номера, като просто ги кажете.

- Гласова транскрипция. В областите, където хората трябва да пишат много, някои интелигентни програми улавят своите думи и ги превеждат в текст. Това е текущо в някои софтуер за текстообработка. Гласовата транскрипция работи и с визуална гласова поща .