Премахване на дубликати в Google Таблици

Premahvane Na Dublikati V Google Tablici



Дублиращите се данни често могат да доведат до объркване, грешки и изкривени прозрения. За щастие, Google Sheets ни предоставя много инструменти и техники за опростяване на задачата за идентифициране и премахване на тези излишни записи. От основни сравнения на клетки до усъвършенствани подходи, базирани на формули, вие ще бъдете оборудвани да трансформирате претрупаните листове в организирани, ценни ресурси.
Независимо дали работите със списъци с клиенти, резултати от проучване или друг набор от данни, елиминирането на дублиращи се записи е основна стъпка към надежден анализ и вземане на решения.
В това ръководство ще разгледаме два метода, които ще ви позволят да идентифицирате и премахнете дублирани стойности.

Създаване на таблица

Първо създадохме таблица в Google Sheets, която ще бъде използвана в примерите по-късно в тази статия. Тази таблица има 3 колони: Колона A, със заглавка „Име“, съхранява имена; Колона B има заглавие „Възраст“, ​​което съдържа възрастта на хората; и накрая, колона C, заглавка „Град“, съдържа градове. Ако наблюдаваме, някои записи в тази таблица се дублират, като например записите за „Джон“ и „Сара“.









Ще работим върху тази таблица, за да премахнем тези дублиращи се стойности с различни методи.



Метод 1: Използване на функцията „Премахване на дубликати“ в Google Таблици

Първият метод, който обсъждаме тук, е да премахнем дублиращите се стойности, като използваме функцията „Премахване на дубликати“ на Google Sheet. Този метод ще премахне завинаги дублиращите се записи от избрания диапазон от клетки.





За да демонстрираме този метод, ще разгледаме отново генерираната по-горе таблица.

За да започнем да работим по този метод, първо трябва да изберем целия диапазон, съдържащ нашите данни, включително заглавки. В този сценарий сме избрали клетки A1:C11 .



В горната част на прозореца на Google Таблици ще видите лента за навигация с различни менюта. Намерете и щракнете върху опцията „Данни“ в лентата за навигация.

Ще се появи падащо меню, когато щракнете върху опцията „Данни“, което ви представя различни инструменти и функции, свързани с данни, които могат да се използват за анализиране, почистване и манипулиране на вашите данни.

За този пример ще трябва да влезем в менюто „Данни“, за да отидем до опцията „Почистване на данни“, която включва функцията „Премахване на дубликати“.

След като получим достъп до диалоговия прозорец „Премахване на дубликати“, ще ни бъде представен списък с колони в нашия набор от данни. Въз основа на тези колони ще бъдат намерени и премахнати дубликати. Ще маркираме съответните квадратчета за отметка в диалоговия прозорец в зависимост от това кои колони искаме да използваме за идентифициране на дубликати.

В нашия пример имаме три колони: „Име“, „Възраст“ и „Град“. Тъй като искаме да идентифицираме дубликати въз основа на трите колони, поставихме отметка и в трите квадратчета. Освен това, трябва да поставите отметка в квадратчето „Данните имат заглавен ред“, ако таблицата ви има заглавки. Тъй като имаме заглавки в предоставената по-горе таблица, поставихме отметка в квадратчето „Данните имат заглавен ред“.

След като сме избрали колоните за идентифициране на дубликати, можем да продължим да премахваме тези дубликати от нашия набор от данни.

Ще намерите бутон в долната част на диалоговия прозорец „Премахване на дубликати“, озаглавен „Премахване на дубликати“. Кликнете върху този бутон.

След като щракнете върху „Премахване на дубликати“, Google Sheets ще обработи вашата заявка. Колоните ще бъдат сканирани и всички редове с дублирани стойности в тези колони ще бъдат премахнати, успешно елиминирайки дубликатите.

Изскачащ екран потвърждава, че дублираните стойности са премахнати от таблицата. Той показва, че два дублиращи се реда са намерени и премахнати, оставяйки таблицата с осем уникални записа.

След използване на функцията „Премахване на дубликати“, нашата таблица се актуализира, както следва:

Важна забележка, която трябва да имате предвид тук, е, че премахването на дубликати с помощта на тази функция е постоянно действие. Дублиращите се редове ще бъдат изтрити от вашия набор от данни и няма да можете да отмените това действие, освен ако нямате резервно копие на данните. Така че, уверете се, че сте избрали правилните колони за намиране на дубликати, като проверите повторно избора си.

Метод 2: Използване на функцията UNIQUE за премахване на дубликати

Вторият метод, който ще обсъдим тук, е използването на ЕДИНСТВЕН ПО РОДА СИ функция в Google Таблици. The ЕДИНСТВЕН ПО РОДА СИ функцията извлича отделни стойности от определен диапазон или колона с данни. Въпреки че не премахва директно дубликати от оригиналните данни, той създава списък с уникални стойности, които можете да използвате за трансформация на данни или анализ без дубликати.

Нека създадем пример, за да разберем този метод.
Ще използваме таблицата, която беше генерирана в началната част на този урок. Както вече знаем, таблицата съдържа определени данни, които се дублират. И така, избрахме клетка 'E2', за да я напишем ЕДИНСТВЕН ПО РОДА СИ формула в. Формулата, която сме написали е следната:

=УНИКАЛНО(A2:A11)

Когато се използва в Google Таблици, формулата UNIQUE извлича уникални стойности в отделна колона. И така, предоставихме тази формула с диапазон от клетка A2 да се A11 , който ще бъде приложен в колона A. Така тази формула извлича уникалните стойности от колона А и ги показва в колоната, където е написана формулата.

Формулата ще бъде приложена към определения диапазон, когато натиснете клавиша Enter.

В тази моментна снимка можем да видим, че две клетки са празни. Това е така, защото две стойности са дублирани в таблицата, а именно Джон и Емили. The ЕДИНСТВЕН ПО РОДА СИ функцията показва само един екземпляр на всяка стойност.

Този метод не премахна дублираните стойности директно от посочената колона, а създаде друга колона, за да ни предостави уникалните записи на тази колона, елиминирайки дубликатите.

Заключение

Премахването на дубликати в Google Таблици е полезен метод за анализиране на данни. Това ръководство демонстрира два метода, които ви позволяват лесно да премахнете дублиращи се записи от вашите данни. Първият метод обяснява използването на Google Sheets за премахване на дублиращата се функция. Този метод сканира посочения диапазон от клетки и елиминира дубликати. Другият метод, който обсъдихме, е да използвате формулата за извличане на дублирани стойности. Въпреки че не премахва директно дубликати от диапазона, вместо това показва уникалните стойности в нова колона.