Как да използвате набори от данни за прегръщащи се лица

Kak Da Izpolzvate Nabori Ot Danni Za Pregr Sasi Se Lica

Приложимостта и използваемостта на моделите за машинно обучение се тества върху данни. Надеждността на тестовете зависи до голяма степен от количеството и качеството на данните, върху които се прилагат тези модели. Пълна задача само по себе си е създаването, получаването и почистването на подходящо голям набор от данни, за да тествате вашите „ Обработка на естествен език (НЛП) ” Модел на машинно обучение.

Hugging Face предлага изискано решение за това със своята изключително голяма библиотека от набори от данни, от които да избирате и да намерите този, който идеално отговаря на вашите изисквания. Тук ще ви покажем как да намерите идеалния набор от данни и да го подготвите, за да тествате адекватно вашия модел.

Как да използвам набори от данни за прегръщащи се лица?

Ще ви покажем как да използвате набори от данни за прегръщане на лица, използвайки примера на „ TinyStories ” Набор от данни от Hugging Face.

Пример

Наборът от данни TinyStories има повече от 2 милиона реда данни в разделянето на влака и има повече от 2 хиляди изтегляния на платформата Hugging Face. Ще го използваме в кода в Google Colab, даден по-долу:

! пип Инсталирай трансформатори
! пип Инсталирай набори от данни

от набори от данни импортирайте load_dataset

набор от данни = load_dataset ( 'roneneldan/TinyStories' )

TinyStories_Story = 3
пример_низ = набор от данни [ 'влак' ] [ TinyStories_Story ] [ 'текст' ]

печат ( примерен_низ )

В този код разгледайте посочените по-долу стъпки:

Стъпка 01 : Първата стъпка е „ инсталация ” от набори от данни за трансформатори.

Стъпка 02 : След това импортирайте необходимия набор от данни, “ TinyStories ” във вашия проект.

Стъпка 03 : След това заредете избрания набор от данни с помощта на „ load_dataset() ” функция.

Стъпка 04 : Сега посочваме номера на историята, който искаме от набора от данни TinyStories. Посочили сме числото 03 в нашия пример за код.

Стъпка 05 : И накрая, ще използваме метода “print()”, за да покажем резултата.

Изход

Забележка: Кодът и изходът също могат да се видят директно в нашия Google Colab .

Заключение

“ Набори от данни за прегърнати лица ” прави невероятно ефикасно за потребителите да тестват своите модели на машинно обучение, докато директно импортират големи набори от данни от тяхната онлайн библиотека. В резултат на това прилагането на NLP алгоритми стана по-лесно и по-бързо, тъй като програмистите могат да тестват проектите си спрямо набор от данни, който има както качество, така и количество.

Как да използвате набори от данни за прегръщащи се лица

Как да използвам набори от данни за прегръщащи се лица?

Пример

Изход

Заключение

Категория

Популярни Публикации

Разбиране на синтаксиса на Makefile: Често срещани проблеми и решения (включително „Липсващ оператор“ и „Входна точка не е намерена“)

Добавяне на базови стилове в Tailwind

Как да проверя автоморфни числа в Java

Как да използвате командата Get-FileHash PowerShell

Python Not Equal Тест

Docker не стартира в Windows Start

Каква е разликата между Docker Import и Load?

Как да добавите и конфигурирате SSH ключ в GitLab

Как да използвате командата alias в Linux

Как да получите достъп и да разберете спецификациите на компютъра на Windows 11?

4 начина за деактивиране на Wi-Fi на Raspberry чрез терминал

Как да покажете хронология на ангажименти за един клон с помощта на Git Log с диапазон

Каква е процедурата за актуализиране на Windows 7 до Windows 10

Какво е AppLocker в Windows

Ключови връзки на Emacs

Какво представлява функцията TRIM за SSD и как да я активирате?

Как да промените „Hey Siri“ на „Siri“ на iPhone, iPad и Mac

Как да разрешите грешката „Curl не може да разреши хост“ в Linux

Как да създадете MySQL база данни в AWS RDS?

Docker Run -v Пример