Pandas Присъединяване срещу Обединяване

„Pandas“ е високоефективен инструмент за средата на Python. Това е „отворен“ изходен код за анализ на данни. Методът за присъединяване на pandas и методът за сливане на pandas се използват за свързване на двата кадъра с данни заедно в един кадър с данни. И в двата метода на pandas разликата е, че функцията „join“ на pandas се присъединява към рамката с данни с помощта на индекс. Докато функцията „сливане“ на pandas се присъединява към рамката с данни, като използва метода на индекса и колоната, в който можем сами да изберем желаната колона. Методът на сливане на pandas се използва най-вече в сравнение с метода на присъединяване на pandas. Софтуерът, който ще използваме за внедряването, е софтуерът „spyder“, който е в средата на Python, което ще ни осигури предимства за внедряването на кода на pandas join method() и функцията на pandas merge().

Синтаксис на метода Pandas Join().

„df1. присъединяване ( df2 ) ”

“df” в горния синтаксис е съкращението на “dataframe”. В синтаксиса има два кадъра с данни с функцията „dot join“, която е за извикване на метода. Това е методът на pandas за свързване на два кадъра с данни. Той работи, като използва индекса за комбиниране на кадрите с данни в един.

Синтаксис на метода Pandas Merge().

„df1. сливане ( df2 , На = име на колона ) ”

Синтаксисът на метода за сливане на pandas има две рамки с данни като „df1“ и „df2“. Функцията „точково сливане“ извиква метода за свързване на двата кадъра с данни с появата на обърнати колони.

Ще разгледаме следните начини за комбиниране на две рамки с данни, за да използваме методите на panda merge и pandas join:

Припокриване на метода Pandas Join.
Пандите се присъединяват към метода чрез нулиране на индекса.
Метод на сливане Pandas (колона „ляво и дясно“).
Ясен метод за сливане на Pandas.

Създаване на рамки за данни за внедряване на метода Pandas Merge и Pandas Join

Първо, трябва да създадем рамка с данни. За това ще използваме инструмента „spyder“. След като го отворите, започнете да пишете кода. Импортирайте панди като „pd“ за асоциацията на библиотеката на панди. Имаме променливите на рамката с данни като „x“, „y“, „p“ и „q“ съответно и „a“ със стойности „1“ и „b“ със стойност, присвоена като „2“.

Резултатът е „df“, създаден с присвоените стойности. Можем да го направим толкова голям, колкото са данните.

Създаване на друга рамка с данни

Трябва да направим друга рамка от данни, за да разберем ясно методите за свързване на панди и сливане на панди. Тук сме създали „df“ по същия начин като горния „df“, само че стойностите на присвоените променливи са различни. Имаме „h“, „j“, „s“ и „d“, докато присвояваме стойности „b“ със стойност „8“ и „Y“ със стойност „3“.

Резултатът показва просто създаден „df“.

Пример # 01: Метод за присъединяване на Pandas (припокриване)

Сега ще видим как да съединим два кадъра с данни с метода за присъединяване на pandas. За този метод можем да изберем колоната по ваш избор, върху която искаме да работим от рамката с данни. Взехме примера с припокриващата се колона „вляво“ от „df“, така че можем да коригираме това с „наставката“, за да преодолеем припокриването на данни. Тук използваните променливи са 'x', 'z', 'v', 'd'. “p”, “o”, “l” и “y” със стойностите, зададени като “3”, “6”, “7” и “9”. „.join“ извиква метода, като подравняването е настроено на ляво присъединяване с десния суфикс „df“. ”. „Суфиксът“, използван в кода, е защото в рамката с данни има две колони, които имат едно и също име, което е „ключ“ и това няма да припокрива данните.

Изходът не показва припокриващи се данни с метода за свързване на два „df“ с помощта на метода за свързване на pandas.

Пример # 02: Метод за присъединяване на Pandas чрез нулиране на индекс

В този пример отделно ще посочим колоната с параметъра „on“, която да използваме като „ключ“ в метода join, който помага при свързването на двата кадъра с данни. комбинираното нещо се прави с този параметър. Освен това индексът на един от двата „df“ трябва да е подобен, за да ги съедини. Подобни видове данни или данни, използвани за една и съща цел, могат да бъдат заедно за обработка. Това ще използва индекса все още, използвайки отдясно. Променливите са 's', 't', 'u', 'v', 'n', 'w', 'k' и 'q'. Присвоените стойности са “3”, “6”, “7” и “9”. „Reset dot index“ е метод на pandas за нулиране на индекса на „df“. Индексът за нулиране настройва всички цели числа на вашия списък с рамка от данни от 0, докато данните на рамката с данни не бъдат там удължени.

Ето изхода, който се показва с метода за свързване на индекс „ключ“ на панди.

Пример # 03: Метод за сливане на Pandas (колона „ляво и дясно“)

Методът за сливане изпълнява подобна операция като метода за присъединяване на pandas. И двата метода са за комбиниране на данни в подобна рамка от данни. Методът на сливане е по-гъвкав, изискващ посочване на ключа. Можем също да го посочим в лявата и дясната колона в зависимост от работата на вашата рамка с данни. Променливите в кода са “s”, “d”, “g”, “f”, “k”, “j”, “b” и “q”. присвоените стойности са “9”, “5”, “6” и “7”. Външното внедряване на „join“ се извършва и на двата „df“ чрез използване на параметъра „how“ на функцията на метода за сливане на pandas.

Резултатът, който виждаме, показва обединените данни на двата кадъра с данни. „NaN“ представлява „не число“, което означава, че когато в данните няма зададен номер, там се показва „NaN“.

Пример # 04: Методът за сливане явно

Тук, в този пример, методът на сливане е унищожаването на индекса и стойността на индекса не се приема в рамката с данни. Ние ще изпълняваме този метод в съответствие с работата, която трябва да бъде свършена, където изричното уточняване е да последва. Той ще обедини данните въз основа на ляв индекс или десен индекс с параметъра. Променливите в тази рамка с данни са “t”, “r”, “I”, “u”, “h”, “o”, “e” и “e”. Присвоените стойности са “2”, “4”, “6” и “4”. Горният пример за метода на сливане на pandas с избор на колона според нуждите е най-представимият и ценен метод за свързване на двата кадъра с данни. Проверка в края на реда с код дали ключът за сливане е уникален в набора от данни.

В изхода по-долу индексът не се показва без индекса, но функцията се изпълнява въз основа на десния и левия индекс.

Заключение

Методите merge() и join() са много удобни и ефективни. И двете функции се използват за свързване на два отделни кадъра с данни в един и същи кадър с данни, но имат различна употреба в зависимост от случая. В тази статия научихме основните разлики между метода за присъединяване и сливане на pandas. След като направихме примерите и разбрахме метода за присъединяване на pandas, ще го завършим със знанието, че ако искаме по-гъвкаво присъединяване в стил на база данни, за предпочитане е да използваме метода за сливане на pandas. От друга страна, ако искаме рамката с данни да се комбинира широко с индекса, можем да използваме функцията на метода pandas join().

Pandas Присъединяване срещу Обединяване

Синтаксис на метода Pandas Join().

Синтаксис на метода Pandas Merge().

Създаване на рамки за данни за внедряване на метода Pandas Merge и Pandas Join

Създаване на друга рамка с данни

Пример # 01: Метод за присъединяване на Pandas (припокриване)

Пример # 02: Метод за присъединяване на Pandas чрез нулиране на индекс

Пример # 03: Метод за сливане на Pandas (колона „ляво и дясно“)

Пример # 04: Методът за сливане явно

Заключение

Категория

Популярни Публикации

Как да инсталирате Rust на Ubuntu

Как да инсталирате командния ред Conda в Ubuntu Linux

Как да конвертирате набор в списък в Java

Кой е най-добрият начин да намерите дали даден елемент е в JavaScript масив

SQL REGEXP_REPLACE

Въведение в типовете записи в C# с примери

Добавете 1 ден към дата с помощта на JavaScript

Как да инсталирате Ruby на Ubuntu 22.04

Как да качите MicroPython фърмуер в ESP32 с помощта на uPyCraft IDE

Какви са стъпките за изпълнение на отдалечени команди в PowerShell?

Roblox – Моят акаунт беше хакнат – какво да правя?

Как да изтриете потребител в Linux

Как да промените цвета на бутоните при задържане на курсора на мишката в CSS?

JavaScript Вземете елемент по име – HTML

Макро функции в C++

Овладяване на Android аларми: Настройте аларми като професионалист

Salesforce Apex – Лимити на управителя

Как да закръглим двойно до два знака след десетичната запетая в Java

Какво е клас и обект в Golang?

Какво представлява Compress-Archive Cmdlet в PowerShell?