Pandas Присъединяване срещу Обединяване

Pandas Pris Edinavane Sresu Obedinavane



„Pandas“ е високоефективен инструмент за средата на Python. Това е „отворен“ изходен код за анализ на данни. Методът за присъединяване на pandas и методът за сливане на pandas се използват за свързване на двата кадъра с данни заедно в един кадър с данни. И в двата метода на pandas разликата е, че функцията „join“ на pandas се присъединява към рамката с данни с помощта на индекс. Докато функцията „сливане“ на pandas се присъединява към рамката с данни, като използва метода на индекса и колоната, в който можем сами да изберем желаната колона. Методът на сливане на pandas се използва най-вече в сравнение с метода на присъединяване на pandas. Софтуерът, който ще използваме за внедряването, е софтуерът „spyder“, който е в средата на Python, което ще ни осигури предимства за внедряването на кода на pandas join method() и функцията на pandas merge().

Синтаксис на метода Pandas Join().

„df1. присъединяване ( df2 )

“df” в горния синтаксис е съкращението на “dataframe”. В синтаксиса има два кадъра с данни с функцията „dot join“, която е за извикване на метода. Това е методът на pandas за свързване на два кадъра с данни. Той работи, като използва индекса за комбиниране на кадрите с данни в един.







Синтаксис на метода Pandas Merge().

„df1. сливане ( df2 , На = име на колона )

Синтаксисът на метода за сливане на pandas има две рамки с данни като „df1“ и „df2“. Функцията „точково сливане“ извиква метода за свързване на двата кадъра с данни с появата на обърнати колони.



Ще разгледаме следните начини за комбиниране на две рамки с данни, за да използваме методите на panda merge и pandas join:



  • Припокриване на метода Pandas Join.
  • Пандите се присъединяват към метода чрез нулиране на индекса.
  • Метод на сливане Pandas (колона „ляво и дясно“).
  • Ясен метод за сливане на Pandas.

Създаване на рамки за данни за внедряване на метода Pandas Merge и Pandas Join

Първо, трябва да създадем рамка с данни. За това ще използваме инструмента „spyder“. След като го отворите, започнете да пишете кода. Импортирайте панди като „pd“ за асоциацията на библиотеката на панди. Имаме променливите на рамката с данни като „x“, „y“, „p“ и „q“ съответно и „a“ със стойности „1“ и „b“ със стойност, присвоена като „2“.





Резултатът е „df“, създаден с присвоените стойности. Можем да го направим толкова голям, колкото са данните.



Създаване на друга рамка с данни

Трябва да направим друга рамка от данни, за да разберем ясно методите за свързване на панди и сливане на панди. Тук сме създали „df“ по същия начин като горния „df“, само че стойностите на присвоените променливи са различни. Имаме „h“, „j“, „s“ и „d“, докато присвояваме стойности „b“ със стойност „8“ и „Y“ със стойност „3“.

Резултатът показва просто създаден „df“.

Пример # 01: Метод за присъединяване на Pandas (припокриване)

Сега ще видим как да съединим два кадъра с данни с метода за присъединяване на pandas. За този метод можем да изберем колоната по ваш избор, върху която искаме да работим от рамката с данни. Взехме примера с припокриващата се колона „вляво“ от „df“, така че можем да коригираме това с „наставката“, за да преодолеем припокриването на данни. Тук използваните променливи са 'x', 'z', 'v', 'd'. “p”, “o”, “l” и “y” със стойностите, зададени като “3”, “6”, “7” и “9”. „.join“ извиква метода, като подравняването е настроено на ляво присъединяване с десния суфикс „df“. ”. „Суфиксът“, използван в кода, е защото в рамката с данни има две колони, които имат едно и също име, което е „ключ“ и това няма да припокрива данните.

Изходът не показва припокриващи се данни с метода за свързване на два „df“ с помощта на метода за свързване на pandas.

Пример # 02: Метод за присъединяване на Pandas чрез нулиране на индекс

В този пример отделно ще посочим колоната с параметъра „on“, която да използваме като „ключ“ в метода join, който помага при свързването на двата кадъра с данни. комбинираното нещо се прави с този параметър. Освен това индексът на един от двата „df“ трябва да е подобен, за да ги съедини. Подобни видове данни или данни, използвани за една и съща цел, могат да бъдат заедно за обработка. Това ще използва индекса все още, използвайки отдясно. Променливите са 's', 't', 'u', 'v', 'n', 'w', 'k' и 'q'. Присвоените стойности са “3”, “6”, “7” и “9”. „Reset dot index“ е метод на pandas за нулиране на индекса на „df“. Индексът за нулиране настройва всички цели числа на вашия списък с рамка от данни от 0, докато данните на рамката с данни не бъдат там удължени.

Ето изхода, който се показва с метода за свързване на индекс „ключ“ на панди.

Пример # 03: Метод за сливане на Pandas (колона „ляво и дясно“)

Методът за сливане изпълнява подобна операция като метода за присъединяване на pandas. И двата метода са за комбиниране на данни в подобна рамка от данни. Методът на сливане е по-гъвкав, изискващ посочване на ключа. Можем също да го посочим в лявата и дясната колона в зависимост от работата на вашата рамка с данни. Променливите в кода са “s”, “d”, “g”, “f”, “k”, “j”, “b” и “q”. присвоените стойности са “9”, “5”, “6” и “7”. Външното внедряване на „join“ се извършва и на двата „df“ чрез използване на параметъра „how“ на функцията на метода за сливане на pandas.

Резултатът, който виждаме, показва обединените данни на двата кадъра с данни. „NaN“ представлява „не число“, което означава, че когато в данните няма зададен номер, там се показва „NaN“.

Пример # 04: Методът за сливане явно

Тук, в този пример, методът на сливане е унищожаването на индекса и стойността на индекса не се приема в рамката с данни. Ние ще изпълняваме този метод в съответствие с работата, която трябва да бъде свършена, където изричното уточняване е да последва. Той ще обедини данните въз основа на ляв индекс или десен индекс с параметъра. Променливите в тази рамка с данни са “t”, “r”, “I”, “u”, “h”, “o”, “e” и “e”. Присвоените стойности са “2”, “4”, “6” и “4”. Горният пример за метода на сливане на pandas с избор на колона според нуждите е най-представимият и ценен метод за свързване на двата кадъра с данни. Проверка в края на реда с код дали ключът за сливане е уникален в набора от данни.

В изхода по-долу индексът не се показва без индекса, но функцията се изпълнява въз основа на десния и левия индекс.

Заключение

Методите merge() и join() са много удобни и ефективни. И двете функции се използват за свързване на два отделни кадъра с данни в един и същи кадър с данни, но имат различна употреба в зависимост от случая. В тази статия научихме основните разлики между метода за присъединяване и сливане на pandas. След като направихме примерите и разбрахме метода за присъединяване на pandas, ще го завършим със знанието, че ако искаме по-гъвкаво присъединяване в стил на база данни, за предпочитане е да използваме метода за сливане на pandas. От друга страна, ако искаме рамката с данни да се комбинира широко с индекса, можем да използваме функцията на метода pandas join().