Дълбоко учене: Машинното обучение в най-фините му

Какво трябва да знаете за еволюцията на изкуствения интелект

Дълбокото обучение е мощна форма на машинно обучение (ML), което изгражда сложни математически структури, наречени невронни мрежи, използващи огромно количество данни (информация).

Deep Learning Definition

Дълбокото обучение е начин за прилагане на ML чрез използване на множество слоеве от невронни мрежи за обработка на по-сложни типове данни. Понякога нареченото йерархично учене, дълбокото обучение използва различни видове невронни мрежи, за да учи функции (наричани също и представителства) и ги намира в големи групи от сурови, немаркирани данни (неструктурирани данни). Една от първите пробивни демонстрации на дълбокото обучение е програма, която успешно изважда снимки на котки от набори от видеоклипове в YouTube.

Примери за дълбоко обучение в ежедневния живот

Дълбокото обучение се използва не само за разпознаване на изображения, но и за езиков превод, разкриване на измами и за анализ на данните, събрани от компаниите за техните клиенти. Например, Netflix използва дълбоко обучение, за да анализира вашите зрителни навици и да предскаже кои предавания и филми предпочитате да гледате. По този начин Netflix знае да поставя филми за действие и природни филми в опашката на предложенията ви. Amazon използва дълбоко обучение, за да анализира скорошните ви покупки и обекти, които наскоро сте търсили, за да създадете предложения за новите музикални албуми в страната, които вероятно ви интересуват, и че сте на пазара за чифт сив и жълт тенис обувки. Тъй като дълбокото обучение предоставя все повече и повече информация от неструктурираните и сурови данни, корпорациите могат по-добре да очакват нуждите на клиентите си, докато вие, индивидуалните клиенти, получавате по-персонализирано обслужване на клиентите.

Изкуствени невронни мрежи и дълбоко учене

За да улесним разбирането на дълбокото обучение, нека отново разгледаме сравнението на изкуствената невронна мрежа (ANN). За дълбоко обучение представете си, че нашата 15-етажна офис сграда заема градски блок с още пет офис сгради. На всяка от улиците има три сгради. Нашата сграда е сграда А и има една и съща страна на улицата като сгради В и С. На улицата от сграда А е сграда 1, а от сградата Б е сграда 2 и т.н. Всяка сграда има различен брой етажи, е изработена от различни материали и има различен архитектурен стил от останалите. Всяка сграда обаче все още е подредена в отделни етажи (слоеве) от офиси (възли), така че всяка сграда е уникална ANN.

Представете си, че цифровия пакет пристига в сграда А, съдържаща много различни видове информация от различни източници, като например текстови данни, видео потоци, аудио потоци, телефонни разговори, радиовълни и фотографии. не е етикетиран или сортиран по никакъв логичен начин (неструктурирани данни). Информацията се изпраща на всеки етаж, за да бъде обработвана от 1- ва до 15 -та . След като информационният бърколет достигне 15 -ия етаж (изход), той се изпраща към първия етаж (вход) на сграда 3 заедно с крайния резултат от обработката от сграда A. Сграда 3 учи от и включва резултата, изпратен от сграда А и след това обработва информационния бъркот през всеки етаж по същия начин. Когато информацията достигне най-горния етаж на сграда 3, тя се изпраща оттам с резултатите от тази сграда до сградата 1. Сградата 1 научава от и включва резултатите от сграда 3 преди да я обработва етаж-до-етаж. Сграда 1 предава информацията и резултатите по същия начин до сграда С, която обработва и изпраща до сграда 2, която обработва и изпраща до сграда B.

Всяка ANN (сграда) в нашия пример търси друга характеристика в неструктурираните данни (бъркотия информация) и предава резултатите до следващата сграда. Следващата сграда включва (научава) резултата (резултатите) от предходната. Тъй като данните се обработват от всяка сграда (ANN), тя се организира и обозначава (класифицира) по конкретна особеност, така че когато данните достигнат крайния изход (последния етаж) на последната сграда (ANN), тя се класифицира и етикетира (по-структуриран).

Изкуственото разузнаване, машинното обучение и дълбокото учене

Как се вписва дълбокото обучение в общата картина на изкуствения интелект (AI) и ML? Дълбокото обучение увеличава силата на ML и увеличава обхвата на задачите, които AI може да изпълни. Тъй като дълбокото обучение се основава на използването на невронни мрежи и разпознаването на функциите в наборите от данни вместо по-прости алгоритми за задача, те могат да намират и използват подробности от неструктурирани (сурови) данни, без да е необходимо програмистът да го маркира първо - консумирана задача, която може да въведе грешки. Дълбокото обучение помага на компютрите да станат по-добре и по-добре да използват данните, за да помогнат както на корпорациите, така и на отделните хора.