01 от 02
Премахване на дублирани записи на данни в Excel
Програмите за електронни таблици , като например Excel, често се използват като бази данни за неща като инвентаризация на части, записи за продажби и пощенски списъци.
Бази данни в Excel се състоят от таблици с данни, които обикновено се организират в редици от данни, наречени записи.
В запис данните във всяка клетка или поле в реда са свързани - например име, адрес и телефонен номер на компанията.
Често срещан проблем, възникващ при нарастване на размера на базата данни, е този на дублиращи се записи или редове от данни.
Това дублиране може да се случи, ако:
- Цялата документация се въвежда в базата данни повече от веднъж, което води до две или повече идентични записи
- Няколко записи имат едно или повече полета - например име и адрес - съдържащи едни и същи данни.
Така или иначе, дублиращите се записи могат да причинят множество проблеми - като например изпращане на няколко копия на документи на едно и също лице, когато информацията за база данни се използва в обединяване на пощата - затова е добра идея да сканирате и премахвате дублиращи се записи на редовни основа.
И докато е лесно да се избират дублиращи се записи в малка извадка като тази на изображението по-горе, таблиците с данни могат лесно да съдържат стотици, ако не и хиляди записи, което прави много трудно да се изберат дублирани записи - особено частично съвпадащи записи.
За да бъде по-лесно да се изпълни тази задача, Excel разполага с вграден инструмент за данни, който не е изненадващ, премахва дубликатите , които могат да бъдат използвани за намиране и премахване на идентични, както и частично съвпадащи записи.
Въпреки това, начина, по който инструментът за премахване на дублирания е проектиран, идентични и частично съвпадащи записи трябва да бъдат разгледани отделно.
Това е така, защото диалоговият прозорец Премахване на дублирания показва имената на полетата за избраната таблица с данни и избирате кои полета да включите в търсенето на съответстващи записи:
- За идентични записи търсете всички полета - оставете отметки до всички имена на колони или полета;
- За частично съвпадение на записите - оставете отметки само до тези полета.
Име на полета срещу писмото на колоната
Както вече споменахме, инструментът "Премахване на дублиращи се" се състои от диалогов прозорец, в който избирате кои съответстващи полета да търсите, като отметнете имената на желаните полета или колони.
Информацията, която се показва в диалоговия прозорец - имена на полета или букви на колони, зависи от това дали вашите данни съдържат ред заглавия - или заглавки - в горната част на таблицата с данни, както е показано на изображението по-горе.
Ако това се случи, уверете се, че опцията от дясната страна на диалоговия прозорец " Моите данни има заглавки" е отметнато и Excel ще покаже имената в този ред като имена на полета в диалоговия прозорец.
Ако данните ви нямат заглавен ред, диалоговият прозорец ще покаже съответните букви на колони в диалоговия прозорец за избрания диапазон от данни.
Съседен диапазон от данни
За да работи правилно инструментът за премахване на дублиращи файлове, таблицата с данни трябва да е съседна област от данни - това означава, че не трябва да има празни редове, колони и, ако изобщо е възможно, няма празни клетки, разположени в таблицата.
Без да имате празни места в таблицата с данни е добра практика, когато става дума за управление на данни като цяло, а не само за търсене на дублирани данни. Другите инструменти за данни на Excel - като сортиране и филтриране - работят най-добре, когато таблицата с данни е съседен диапазон от данни.
Премахване на дублиращи се записи на данни Пример
В горното изображение таблицата с данни съдържа две еднакви записи за А. Томпсън и две частично съвпадащи записи за R. Holt - където всички полета съвпадат с номера на студента.
Посочените по-долу стъпки подробно описват как да използвате инструмента за премахване на дублиращите данни, за да:
- Премахнете втората от две еднакви записи за А. Томпсън.
- Премахнете втория частично съвпадащ запис за R. Holt.
Отваряне на диалоговия прозорец Премахване на дублирания
- Кликнете върху всяка клетка, съдържаща данни в примерната база данни.
- Кликнете върху раздела Данни на лентата.
- Кликнете върху иконата за премахване на дублирания, за да маркирате всички данни в таблицата с данни и да отворите диалоговия прозорец Премахване на дублирания .
- В диалоговия прозорец Премахване на дублирания се показват всички заглавия на колони или имена на полета от нашата извадка с данни
- Маркерите за отметки до имената на полетата показват кои колони Excel ще се опитат да съвпадат при търсене на дублирани записи
- По подразбиране, когато се отвори диалоговият прозорец, всички имена на полетата са отметнати
Намиране на идентични записи
- Тъй като търсим напълно идентични записи в този пример, ще оставим проверка на всички заглавия на колоните
- Кликнете върху OK
На този етап трябва да се видят следните резултати:
- Диалоговият прозорец трябва да се затвори и да бъде заменен с съобщение, което казва: 1 намерени и премахнати дублирани стойности; Остават 7 уникални стойности.
- Редът, съдържащ дублиращия се запис на А. Томпсън, ще бъде премахнат от базата данни
- Въпреки че има две частично съвпадащи записи за R. Holt, защото не всички полета съвпадат - студентният номер за двете записи се различава - Excel счита, че това е уникален запис на данни
02 от 02
Намерете и премахнете частично съвпадащи записи с премахване на дублираните
Проверка на едно поле всеки път
Тъй като Excel премахва само записи за данни, които съвпадат точно за избраните полета, най-добрият начин да намерите всички частично съвпадащи записи на данни е да премахнете отметката само за едно поле в даден момент, както е направено в стъпките по-долу.
Следващите търсения на записи, съвпадащи във всички полета, с изключение на име, възраст или програма, ще премахнат всички възможни комбинации за частично съвпадение на записите.
Намиране на частично съвпадащи записи
- Кликнете върху всяка клетка, съдържаща данни в таблицата с данни, ако е необходимо
- Кликнете върху раздела Данни на лентата .
- Кликнете върху иконата за премахване на дублирания, за да маркирате всички данни в таблицата с данни и да отворите диалоговия прозорец Премахване на дублирания .
- Всички имена на полета или заглавия на колони за таблицата с данни са избрани.
- За да намерите и премахнете записи, които нямат съвпадение във всяко поле, премахнете отметката от тях, освен тези имена на полета, които Excel трябва да игнорират.
- За този пример кликнете върху квадратчето до заглавието на графата Student ID, за да премахнете отметката.
- Сега Excel ще търси и премахва записи, които имат съвпадащи данни в полетата " Популярно име" , " Инициали " и " Програма" .
- Кликнете върху OK
- Диалоговият прозорец трябва да се затвори и да бъде заменен с съобщение, което казва: 1 намерени и премахнати дублирани стойности; Остават 6 уникални стойности.
- Редът, съдържащ втория запис за R. Holt с Student ID на ST348-252, ще бъде премахнат от базата данни.
- Кликнете върху OK, за да затворите полето за съобщения
На този етап таблицата с примерни данни не трябва да съдържа всички дублирани данни.