Как да чета Excel (xlsx) файл в python

How Read Excel File Python



The .xlsx е разширение на документа на excel, което може да съхранява голямо количество данни в таблична форма, а много видове аритметични и логически изчисления могат да се извършват лесно в електронна таблица на excel. Понякога се налага да се четат данните от документа на excel с помощта на скрипт Python за програмиране. В Python съществуват много модули за четене на документа на Excel. Някои от полезните модули са xlrd , openpyxl , и панди . Начините за използване на тези модули за четене на Excel файла в Python са показани в този урок.

Предпоставка:

За да проверите примерите на този урок, ще е необходим фиктивен Excel файл с разширението .xlsx. Можете да използвате всеки съществуващ Excel файл или да създадете нов. Тук е нов Excel файл с име sales.xlsx файлът е създаден със следните данни. Този файл е използван за четене чрез използване на различни модули на python в следващата част на този урок.







sales.xlsx



Дата на продажба Продавач Количество
05/12/18 Сила Ахмед 60000
12.06.19 Аз Hossain 50 000
08/09/20 Сармин Джахан 45000
04/07/21 Махмудул Хасан 30000

Пример-1: Прочетете Excel файла с помощта на xlrd

Модулът xlrd не е инсталиран с Python по подразбиране. Така че, трябва да инсталирате модула, преди да го използвате. Последната версия на този модул не поддържа Excel файла с разширението .xlsx. Така че, трябва да инсталирате версията 1.2.0 на този модул, за да прочетете xlsx файла. Изпълнете следната команда от терминала, за да инсталирате необходимата версия на xlrd .



$пипИнсталирай xlrd== 1.2.0

След като приключите процеса на инсталиране, създайте python файл със следния скрипт, за да прочетете sales.xlsx файл с помощта xlrd модул. open_workbook () функцията се използва в скрипта отворете xlsx файла за четене. Този Excel файл съдържа само един лист. Така че работна книга.sheet_by_index () функцията е използвана в скрипта със стойността на аргумента 0. След това вложеното 'за' loop използва за четене на стойностите на клетките на работния лист, като използва стойностите на редовете и колоните. Две функции range () са използвани в скрипта за определяне на размера на реда и колоната въз основа на данните от листа. The cell_value () функция е използвала за четене на конкретната клетъчна стойност на листа във всяка итерация на цикъла. Всяко поле в изхода ще бъде разделено с едно табулаторно пространство.





# Импортирайте модула xlrd
импортиране на xlrd

# Отворете работната книга
работна книга = xlrd.open_workbook('sales.xlsx')

# Отворете работния лист
работен лист = работна книга.sheet_by_index(0)

# Итерация на редовете и колоните
заiвдиапазон(0,5):
зайвдиапазон(0,3):
# Отпечатайте стойностите на клетката с табулатор
печат(работен лист.cell_value(i, j),край='T')
печат('')

Изход:

Следният изход ще се появи след изпълнение на горния скрипт.



Пример-2: Прочетете Excel файла с помощта на openpyxl

The openpyxl е друг модул на python за четене на xlsx файла и също не е инсталиран с Python по подразбиране. Изпълнете следната команда от терминала, за да инсталирате този модул, преди да го използвате.

$пипИнсталирайopenpyxl

След като приключите процеса на инсталиране, създайте python файл със следния скрипт, за да прочетете sales.xlsx файл. Подобно на модула xlrd, openpyxl модулът има load_workbook () функция за отваряне на xlsx файла за четене. The sales.xlsx file се използва като стойност на аргумента на тази функция. Обектът на wookbook.active е създаден в скрипта, за да прочете стойностите на max_row и max_column Имоти. Тези свойства са използвани в вложените цикли за четене на съдържанието на sales.xlsx файл. Функцията range () е използвана за четене на редовете на листа, а функцията iter_cols () е използвана за четене на колоните на листа. Всяко поле в изхода ще бъде разделено с две раздели.

# Импортиране на модул openyxl
импортиране на openpyxl

# Определете променлива за зареждане на wookbook
wookbook = openpyxl.load_workbook('sales.xlsx')

# Определете променлива за четене на активния лист:
работен лист = wookbook.active

# Итерирайте цикъла, за да прочетете стойностите на клетката
заiвдиапазон(0, работен лист.max_row):
за с вработен лист.iter_cols(1, работен лист.max_column):
печат(с[i]. стойност,край='TT')
печат('')

Изход:

Следният изход ще се появи след изпълнение на горния скрипт.

Пример-3: Прочетете Excel файла с помощта на pandas

Модулът pandas не е инсталиран с подобен на python предишния модул. Така че, ако не сте го инсталирали преди, трябва да го инсталирате. Изпълнете следната команда, за да инсталирате панди от терминала.

$пипИнсталирайпанди

След като приключите процеса на инсталиране, създайте python файл със следния скрипт, за да прочетете sales.xlsx файл. The read_excel () функцията на pandas се използва за четене на xlsx файла. Тази функция е използвана в скрипта за четене на sales.xlsx файл. The DataFrame () функцията е използвала тук за четене на съдържанието на xlsx файла в рамката с данни и съхраняване на стойностите в имената на променливата данни . Стойността на данните е отпечатана по -късно.

# Импортирайте панди
внос на пандикатоpd

# Заредете xlsx файла
excel_data = pd.read_excel('sales.xlsx')
# Прочетете стойностите на файла в рамката за данни
данни = pd.DataFrame(excel_data,колони=[„Дата на продажба“,'Продавач','Количество'])
# Отпечатайте съдържанието
печат(„Съдържанието на файла е:н', данни)

Изход:

Следният изход ще се появи след изпълнение на горния скрипт. Резултатът от този скрипт е различен от предишните два примера. Номерата на редовете се отпечатват в първата колона, където стойността на реда е отчетена от 0. Стойностите на датата са подравнени централно. Имената на продавачите са подравнени вдясно. Сумата е подравнена наляво.

Заключение:

Потребителите на python трябва да работят с xlsx файлове за различни цели на програмиране. Три различни начина за четене на xlsx файла са показани в този урок с помощта на три модула на python. Всеки модул има различни функции и свойства за четене на xlsx файла. Този урок ще помогне на потребителите на python да прочетат лесно xlsx файла с помощта на скрипта python след като прочетат този урок.