Премахване на дублирани редове от данни в Excel

01 от 02

Премахване на дублирани записи на данни в Excel

Премахване на дублираните - Търсене на идентични записи по име на поле. © Тед Френски

Програмите за електронни таблици , като например Excel, често се използват като бази данни за неща като инвентаризация на части, записи за продажби и пощенски списъци.

Бази данни в Excel се състоят от таблици с данни, които обикновено се организират в редици от данни, наречени записи.

В запис данните във всяка клетка или поле в реда са свързани - например име, адрес и телефонен номер на компанията.

Често срещан проблем, възникващ при нарастване на размера на базата данни, е този на дублиращи се записи или редове от данни.

Това дублиране може да се случи, ако:

Така или иначе, дублиращите се записи могат да причинят множество проблеми - като например изпращане на няколко копия на документи на едно и също лице, когато информацията за база данни се използва в обединяване на пощата - затова е добра идея да сканирате и премахвате дублиращи се записи на редовни основа.

И докато е лесно да се избират дублиращи се записи в малка извадка като тази на изображението по-горе, таблиците с данни могат лесно да съдържат стотици, ако не и хиляди записи, което прави много трудно да се изберат дублирани записи - особено частично съвпадащи записи.

За да бъде по-лесно да се изпълни тази задача, Excel разполага с вграден инструмент за данни, който не е изненадващ, премахва дубликатите , които могат да бъдат използвани за намиране и премахване на идентични, както и частично съвпадащи записи.

Въпреки това, начина, по който инструментът за премахване на дублирания е проектиран, идентични и частично съвпадащи записи трябва да бъдат разгледани отделно.

Това е така, защото диалоговият прозорец Премахване на дублирания показва имената на полетата за избраната таблица с данни и избирате кои полета да включите в търсенето на съответстващи записи:

Име на полета срещу писмото на колоната

Както вече споменахме, инструментът "Премахване на дублиращи се" се състои от диалогов прозорец, в който избирате кои съответстващи полета да търсите, като отметнете имената на желаните полета или колони.

Информацията, която се показва в диалоговия прозорец - имена на полета или букви на колони, зависи от това дали вашите данни съдържат ред заглавия - или заглавки - в горната част на таблицата с данни, както е показано на изображението по-горе.

Ако това се случи, уверете се, че опцията от дясната страна на диалоговия прозорец " Моите данни има заглавки" е отметнато и Excel ще покаже имената в този ред като имена на полета в диалоговия прозорец.

Ако данните ви нямат заглавен ред, диалоговият прозорец ще покаже съответните букви на колони в диалоговия прозорец за избрания диапазон от данни.

Съседен диапазон от данни

За да работи правилно инструментът за премахване на дублиращи файлове, таблицата с данни трябва да е съседна област от данни - това означава, че не трябва да има празни редове, колони и, ако изобщо е възможно, няма празни клетки, разположени в таблицата.

Без да имате празни места в таблицата с данни е добра практика, когато става дума за управление на данни като цяло, а не само за търсене на дублирани данни. Другите инструменти за данни на Excel - като сортиране и филтриране - работят най-добре, когато таблицата с данни е съседен диапазон от данни.

Премахване на дублиращи се записи на данни Пример

В горното изображение таблицата с данни съдържа две еднакви записи за А. Томпсън и две частично съвпадащи записи за R. Holt - където всички полета съвпадат с номера на студента.

Посочените по-долу стъпки подробно описват как да използвате инструмента за премахване на дублиращите данни, за да:

  1. Премахнете втората от две еднакви записи за А. Томпсън.
  2. Премахнете втория частично съвпадащ запис за R. Holt.

Отваряне на диалоговия прозорец Премахване на дублирания

  1. Кликнете върху всяка клетка, съдържаща данни в примерната база данни.
  2. Кликнете върху раздела Данни на лентата.
  3. Кликнете върху иконата за премахване на дублирания, за да маркирате всички данни в таблицата с данни и да отворите диалоговия прозорец Премахване на дублирания .
  4. В диалоговия прозорец Премахване на дублирания се показват всички заглавия на колони или имена на полета от нашата извадка с данни
  5. Маркерите за отметки до имената на полетата показват кои колони Excel ще се опитат да съвпадат при търсене на дублирани записи
  6. По подразбиране, когато се отвори диалоговият прозорец, всички имена на полетата са отметнати

Намиране на идентични записи

  1. Тъй като търсим напълно идентични записи в този пример, ще оставим проверка на всички заглавия на колоните
  2. Кликнете върху OK

На този етап трябва да се видят следните резултати:

02 от 02

Намерете и премахнете частично съвпадащи записи с премахване на дублираните

Премахване на дубликати - Търсене на частично съвпадащи записи по име на поле. © Тед Френски

Проверка на едно поле всеки път

Тъй като Excel премахва само записи за данни, които съвпадат точно за избраните полета, най-добрият начин да намерите всички частично съвпадащи записи на данни е да премахнете отметката само за едно поле в даден момент, както е направено в стъпките по-долу.

Следващите търсения на записи, съвпадащи във всички полета, с изключение на име, възраст или програма, ще премахнат всички възможни комбинации за частично съвпадение на записите.

Намиране на частично съвпадащи записи

  1. Кликнете върху всяка клетка, съдържаща данни в таблицата с данни, ако е необходимо
  2. Кликнете върху раздела Данни на лентата .
  3. Кликнете върху иконата за премахване на дублирания, за да маркирате всички данни в таблицата с данни и да отворите диалоговия прозорец Премахване на дублирания .
  4. Всички имена на полета или заглавия на колони за таблицата с данни са избрани.
  5. За да намерите и премахнете записи, които нямат съвпадение във всяко поле, премахнете отметката от тях, освен тези имена на полета, които Excel трябва да игнорират.
  6. За този пример кликнете върху квадратчето до заглавието на графата Student ID, за да премахнете отметката.
  7. Сега Excel ще търси и премахва записи, които имат съвпадащи данни в полетата " Популярно име" , " Инициали " и " Програма" .
  8. Кликнете върху OK
  9. Диалоговият прозорец трябва да се затвори и да бъде заменен с съобщение, което казва: 1 намерени и премахнати дублирани стойности; Остават 6 уникални стойности.
  10. Редът, съдържащ втория запис за R. Holt с Student ID на ST348-252, ще бъде премахнат от базата данни.
  11. Кликнете върху OK, за да затворите полето за съобщения

На този етап таблицата с примерни данни не трябва да съдържа всички дублирани данни.