Какво е кръстосано валидиране в AWS?

Машинното обучение се използва за прилагане на различни модели върху дадени данни, за да се предскаже бъдещето въз основа на данните, които се използват за тяхното обучение. Има различни модели за машинно обучение, които вграждат изкуствен интелект, като логистична регресия, K-най-близки съседи и т.н. За да намерите кой модел трябва да се приложи според набора от данни и сценариите, може да се направи чрез кръстосано валидиране.

Това ръководство ще обясни кръстосаното валидиране и работата му с помощта на услугата AWS.

Какво е кръстосано валидиране?

Кръстосаното валидиране позволява на разработчиците да сравняват различни модели на машинно обучение и да получат представа за тяхната работа в реалния живот. Помага на потребителя да разбере кой модел на машинно обучение (ML) или задълбочено обучение (DL) ще работи по-добре за конкретни данни или сценарий. Има ситуации, когато могат да се използват множество модели за един набор от данни, тук разработчиците използват кръстосано валидиране, за да получат подходящ модел за получаване на оптимизирани резултати:

Как работи кръстосаното валидиране?

За да провери ML моделите на набор от данни, потребителят трябва да оцени характеристиките на модела, което се нарича обучение на алгоритъма. Друго нещо, което трябва да се провери, е оценката на модела, за да се установи колко добре се представя и това се нарича тестване на модела. Не е добра идея да тествате модела върху всички данни, но ние използваме 75% от данните за обучение и 25% за тестване, за да получим по-добри резултати. Кръстосаното валидиране извършва тестване на всеки 25% от данните, за да провери кой блок работи най-добре:

Какво е Amazon SageMaker?

Кръстосаното валидиране в AWS може да се извърши с помощта на услугата Amazon SageMaker, тъй като е предназначена за изграждане, обучение и внедряване на модели за машинно обучение. Той помага на учените и разработчиците на данни да подготвят данни за изграждане на ефективни ML или DL модели чрез обединяване на специално създадени възможности. Тези възможности са полезни за изграждане на оптимизирани и точни модели, които ще имат способността да се подобряват с течение на времето:

Характеристики на Amazon SageMaker

Amazon SageMaker е управлявана услуга и не изисква управление на ML среди. Той се нуждае от много данни, за да обучи и изгради ML модели, така че да се свързва добре с услугите Amazon S3 или Amazon Redshift за събиране на данни. Необработените данни могат да бъдат трудни за получаване на информация, така че също така изискват функции за изграждане на модели. След това използвайте данните, за да обучите модели и след това извършете тестове върху тях, като използвате всеки 25% от данните, за да получите по-добри резултати/прогнози:

Това е всичко относно кръстосаното валидиране в AWS.

Заключение

Кръстосаното валидиране е процес на получаване на оптимално машинно обучение или модел на дълбоко обучение за данните, за да получите по-добри резултати. Той ще извърши тестване за всеки 25% раздел от данните, за да разбере кой блок осигурява максимален изход, което го прави подходящ подходящ модел. AWS предоставя услугата SageMaker за извършване на кръстосано валидиране и изграждане на модели за машинно обучение в облака. Това ръководство обяснява процеса на кръстосано валидиране и работата му в AWS.

Какво е кръстосано валидиране в AWS?