Какво представлява извличането на данни?

Големите компании знаят повече за теб, отколкото можеш да си представиш - ето как

Извличането на данни е анализ на големи количества данни, за да се открият модели и знания. Всъщност извличането на данни е известно също като откриване на данни или откриване на знания.

Извличането на данни използва статистически данни, принципи за машинно обучение (ML), изкуствен интелект (AI) и огромно количество данни (често от бази данни или набори от данни), за да идентифицират моделите по начин, който е автоматизиран и полезен.

Какво прави Data Mining?

Извличането на данни има две основни цели: описание и прогнозиране. Първо, извличането на данни описва прозренията и знанията, получени от анализа на моделите в данните. Второ, извличането на данни използва описанията на разпознатите модели на данни, за да предскаже бъдещите модели.

Например, ако сте прекарали известно време в уебсайта за пазаруване за книги за това как да идентифицирате различни видове растения, услугите за извличане на данни, които работят зад кулисите на този уеб сайт, записват описание на вашите търсения във връзка с вашия профил. Когато влезете отново две седмици по-късно, услугите за извличане на данни от уебсайта използват описанията на предишните ви търсения, за да прогнозират текущите Ви интереси и да предложат персонализирани препоръки за пазаруване, които включват книги за идентифициране на растения.

Как работи извличането на данни

Извличането на данни работи с помощта на алгоритми, набори от инструкции, които разказват на компютър или обработват как да изпълняват задачи, за да открият различни видове модели в рамките на данните. Няколко от различните методи за разпознаване на шаблони, използвани при извличането на данни, включват клъстерен анализ, откриване на аномалии, асоциативно обучение, зависимости от данни, решени дървета, регресионни модели, класификации, откриване на излишъци и невронни мрежи.

Докато извличането на данни може да се използва за описание и предсказване на модели във всички различни видове данни, употребата, с която много хора се срещат най-често, дори да не го осъзнават, е да опише модели в покупките ви и поведението, решения.

Като пример, някога сте се чудили как Facebook винаги изглежда, че знае какво гледате онлайн и показва реклами в новинарския си канал, свързани с други сайтове, които сте посетили, или с търсенията в мрежата ви? Извличането на данни от Facebook използва информация, съхранена във Вашия браузър, която проследява вашите дейности, като "бисквитки" , заедно със собствените си познания за вашите модели въз основа на предишната ви употреба на услугата Facebook, за да откриете и предскажете продукти или предложения, от които може да ви заинтересува.

Какъв вид данни могат да бъдат добивани?

В зависимост от услугата или магазина (физическите магазини използват извличането на данни също), може да се извлече изненадващо количество данни за вас и вашите модели. Събраните данни за вас може да включват какъв тип превозно средство карате, къде живеете, места, които сте пътували, списания и вестници, на които сте се абонирали и дали сте женени или не. Тя може също така да определи дали имате деца или не, какви са вашите хобита, каква група харесвате, вашите политически настроения, това, което купувате онлайн, какво купувате във физически магазини (често чрез карти за възнаграждение на клиентите) и всякакви детайли, които споделяте за живота си в социалните медии.

Например търговците на дребно и модните публикации, насочени към тийнейджърите, използват впечатления от снимки за извличане на данни по социални медийни услуги като Instagram и Facebook, за да предскажат модни тенденции, които ще привлекат купувачите на дребно или читателите. Прозренията, открити чрез извличането на данни, могат да бъдат толкова точни, че някои търговци на дребно дори могат да предвидят дали една жена може да е бременна, въз основа на много специфични промени в нейните възможности за закупуване. Търговецът на дребно Target се отчита с такава точност, като предсказва бременност въз основа на модели за закупуване на история, като изпраща кукла за бебешки продукти на млада дама, като раздава тайната за бременността, преди да каже на семейството си.

Извличането на данни е навсякъде, но голяма част от информацията, открита и анализирана за навиците ни за пазаруване, личните предпочитания, избора, финансирането и онлайн дейностите, се използват от магазини и услуги с цел да се подобри опитът на клиентите.