Колона Pandas Insert().

Kolona Pandas Insert



„Python предоставя широк набор от структури от данни и операции за обработка на числени данни и данни от времеви серии. DataFrame, който сме създали или импортирали в Pandas, може да се използва за различни цели. Колоните в рамката с данни също могат да бъдат коригирани, заедно с източника на данни. Pandas опростява много от досадните, отнемащи време задачи, свързани с обработката на данните. Има четири начина за добавяне на колона към DataFrame в Pandas, но в тази статия ние използваме функцията „insert()“ на колоната на panda.

След като изградим или заредим нашия dataFrame в Pandas, има различни неща, които можем да искаме да постигнем. Например, може да продължим да манипулираме данни, например, като променим колоните в рамката с данни. След това трябва да разберем как да включим колони в рамка с данни, ако по-голямата част от данните идват от един доставчик на данни, но някои данни идват от друг. Колона може лесно да бъде добавена към Pandas dataFrame.“







Метод Pandas insert().

Последната колона на рамката с данни се генерира от различна функция. Като използвате метода „insert()“ на DataFrame, можете да добавяте колони между текущите колони, вместо да ги добавяте в долната част на pandas DataFrame. Той ни предлага опцията да добавим колона където изберем, а не просто в края. Освен това предлага много начини за добавяне на стойностите за колоните. Когато трябва да добавите колона на определена позиция или индекс, функцията „insert()“ на pandas е полезна.



Синтаксис за колоната Pandas insert().



Пример 1: Вмъкване на колона в рамка с данни с помощта на метода Pandas insert().

Започнете с първия пример на статията, в който ще обясним как да вмъкнете колона в рамка с данни. С помощта на инструмента „spyder“ можем да докажем този код. Първо генерираме рамка с данни, наречена „курс“. Имаме две колони в тази рамка с данни, „course_title“ и „fee“. В колоната “course_title” имаме списък с курсове “python”, “java”, “object_oriented” и “PHP”. Във втората колона „такса“ имаме списък с такси за курсове, който е „30000“, „25000“, „15000“ и „22000“. Показване на нашия dataFrame, „курс“, чрез използване на „pd. DataFrame”.





След това ще обсъдим основната функция на кода, която е pandas „insert() column“. Ефикасен метод е да включите нов списък в рамката с данни. Можете да добавите новата колона на всяко определено място, като използвате метода за вмъкване. Този метод също позволява ръчно добавяне на колона към рамка с данни, но има по-малка адаптивност.

По време на вмъкването означава, че източникът DataFrame се актуализира директно по време на процеса и не се създава нова DataFrame. В този случай добавихме нова колона към нашия кадър с данни с името „Time_duration“, като използвахме функцията „insert()“. Списъкът със стойности, които имаме в тази колона, е „6_months“, „3_months“, „3months“ и „6_months“. Имаме колона „Time_duration“ с индекс, дефиниран като „2“ в програмата по-долу. Тъй като посоченият индекс, на DataFrame ще бъде даден диапазон, който започва от 0 и се увеличава на стъпки, така че това означава, че тази колона се показва като трета колона в рамката с данни. DataFrame добавя нова колона с име „Time _duration“, като използва функцията „pd.insert()“.



А сега нека обсъдим изхода на програмата отгоре. Неговият изход показва рамка с данни, която има три колони. Допълнителната колона се добавя в края на рамката с данни. С помощта на метода „pd.DataFrame.insert()“ можете да добавите колона сред другите колони, вместо да ги добавяте в края на pandas DataFrame. „Time_duration“ е нова колона, която добавихме с помощта на „вмъкване“ функция. Позиция „2“ се отнася до третата колона в DataFrame, тъй като позицията започва от 0. Колоната се добавя към последното място в рамката с данни.

Пример 2:  Добавяне на колони в рамка с данни чрез използване на функцията Pandas insert().

Ще използваме метода „insert()“, за да добавим нови колони към рамката с данни. Вместо да добавяте допълнителни колони в края на пандите, можете да ги вмъкнете между съществуващите колони. За да генерираме рамка с данни, подобна на предишния пример, взехме три колони и им присвоихме стойности. В първата колона, „Име“, имаме списък с имена, които включват „Ема“, „Ела“, „Смит“ и „Максуел“. Във втората колона „Възраст“ в списъка със стойности имаме „29“, „36“, „39“ и „33“.

След това отпечатваме израз „DataFrame“. Ще покажем рамката с данни под израза „рамка с данни“. Създаваме още една колона за рамката с данни на Pandas, използвайки функцията „insert()“. Трябва да се създаде списък, така че да може да бъде добавен като нова колона към нашия набор от данни. Методът “assign()” на pandas DataFrame може също да се използва за добавяне на повече колони. Вмъкваме нова колона, като използваме „df. вмъкване”. Допълнителната колона с име „Пол“ показва пола като „Мъжки“ или „Женски“.

Нека просто отпечатаме друго изявление, „Нова рамка с данни“. Сега ще бъде представен нов кадър с данни под израза „Нов кадър с данни“, съдържащ допълнителната колона, която добавихме с „pd. вмъкни()” функция. Колоната с подобно име не може да бъде добавена чрез функцията “insert()”. В случай, че колона вече съществува в рамката с данни, по подразбиране се хвърля грешка в стойността.

В този изход колоната, която направихме с помощта на функцията „insert()“, се добавя към рамката с данни. Неговият изход показва два кадъра с данни; първият dataFrame беше създаден с помощта на “pd.data frame”, в който имаме две колони, “Име” и “Възраст”. Новата колона „пол“, която добавихме с помощта на функцията „insert()“, е показана във втория кадър с данни, показан по-долу. Тази рамка с данни показва, че има три колони с някои данни в тях. Индексът е с размер „2“, което означава, че има записи от „0 до 3“. Новата колона, която присвоихме на този кадър с данни, има индексна позиция „3“.

Заключение

Често използвана операция за анализ и актуализиране на данни е добавянето на колони към DataFrame. Pandas обаче ви дава множество опции за изпълнение на задачата, като предлага четири различни метода; ние обаче използваме само една техника, която е колоната „insert()“ на panadas в нашата статия. Една от най-трудните части на разширяването на DataFrame с нови колони е индексирането. Нека набързо опишем и двата примера. Първо създадохме рамка с данни със заглавие курс и добавихме колоните „заглавие на курс“ и „такса“ и присвоихме стойности на тази колона. С помощта на функцията „insert()“ след това добавяме нова колона към същата рамка с данни, посочвайки нейната позиция като „2“ в индекса. Във втория пример са показани два DataFrames. Създадохме две колони и изброихме някои стойности в първия кадър с данни. След това, използвайки функцията insert(), вмъкнахме нова колона в рамката с данни, наречена „Пол“, тя също беше позиционирана като „2“ в индекса; сега отново изведе таблицата, както е показано в горния втори пример.

След усвояване на горните техники, можем лесно да добавяме нови колони към DataFrame.