Функция Sample() в R

Funkcia Sample V R



В R получаваме произволни примерни стойности от вектор или списък с помощта на функцията sample(). Това ни позволява произволно да избираме подмножество от данни, което е полезно в много статистически приложения. Ако входът е списък във функцията sample(), изходът също ще бъде списък със същия брой елементи, но с избраните елементи. Тази статия демонстрира функцията sample() на R с имплементацията, която задава различните аргументи.

Пример 1: Използване на функцията Sample() с аргумента Data

Функцията sample() на R трябва да бъде осигурена с примерните данни за произволно генериране на число. Примерните данни са задължителният аргумент на функцията sample(), чийто код е даден в следното:

dataX < - ° С ( 10 , двадесет , 30 , 40 , петдесет , 60 , 70 , 80 , 90 , 100 )

проба ( dataX , 3 )

проба ( dataX , 3 )

Тук първо генерираме векторите на целочислените елементи в променливата „dataX“. След това извикваме два пъти функцията sample() в кода и предаваме вектора „dataX“, който преди това сме генерирали като аргумент към нея. Първото използване на извадката (dataX, 3) взема произволна извадка от три елемента от вектора „dataX“. Резултатите са произволна пермутация на три елемента от „dataX“. След това отново използваме извадката (a, 5), която взема друга независима произволна извадка от три елемента от вектора „dataX“. Този път резултатът е напълно различен от предишния.







Резултатът показва различните елементи при извикване на функцията sample() два пъти. Имайте предвид, че всеки път, когато създаваме извадката на случаен принцип, се получават различни елементи от векторите:





Пример 2: Използване на функцията Sample() с аргумента Replace

Освен това имаме аргумента „замяна“ на функцията sample(), който приема логическите стойности. Подобен елемент може да бъде избран повече от веднъж, ако елементът е избран с опцията за заместване TRUE. Въпреки това, ако стойността е зададена на FALSE, може да има само една селекция от всеки елемент, което води до вземане на проби от елементите без замяна.





произволни_числа = ° С ( единадесет , 25 , 12 , 89 , Четири пет , 16 , 67 , 38 , 96 , 55 , 73 )

проба ( произволни_числа , 4 , замени = ВЯРНО )

проба ( произволни_числа , 5 , замени = ВЯРНО )

Тук първо дефинираме вектора с някои числови стойности в променливата 'random_numbers'. След това извикваме функцията sample(), където „random_numbers“ се предава като аргумент. Стойността на „4“ е посочена за функцията sample(), което показва, че тя избира само четири произволни стойности от векторите в „random_numbers“.

След това replace=TRUE във функцията sample() указва, че всяка стойност може да бъде избрана повече от веднъж. След това отново разгръщаме функцията sample(), която този път избира „5“ произволни стойности от векторите. По същия начин задаваме аргумента за замяна с „ВЯРНО“, както преди за множеството опции за избор за всяка стойност.



Както виждаме, първият изход показва вектора от 4 произволно избрани елемента от вектора “random_numbers”. Следващият изход обаче показва вектор от „5“ произволно избрани елемента:

Пример 3: Използване на функцията Sample() с аргумента Size

Следващият аргумент, който функцията sample() предава, е „размерът“. „Размерът“ е незадължителен параметър, който показва стойността на пробите, които трябва да бъдат изтеглени. Кодът на функцията sample() с параметъра 'size' е даден по следния начин:

вектори < - 1 : 10

проба ( вектори , размер = 5 )

Тук числовият вектор се дефинира като поредица от цели числа от 1 до 10 в променливата „вектори“. След това функцията sample() се използва за избор на произволни елементи от вектора. Както виждаме, функцията sample() приема два аргумента. Първият аргумент са векторите, от които получаваме извадката. Следващият аргумент е размерът, който е определен със стойността „5“, което показва, че има само пет елемента за избор от вектора.

Следователно избраните елементи се връщат в произволен ред като нов вектор в следния изход:

Пример 4: Използване на функцията Sample() за R списъка

Освен това функцията sample() може да се използва за списъка в R. Този раздел на примера получава произволни стойности от списъка.

R_списък < - списък ( 1 : 4 ,

913 ,

° С ( 'Х' , 'YYY' , 'ДОБРЕ' ) ,

'ZZZ' ,

5 )

резултат < - R_списък [ проба ( 1 : дължина ( R_списък ) , размер = 4 ) ]

резултат

Тук списъкът на „R_list“ е дефиниран с елементи от различни типове, включително вектор от числа, едно число, символен вектор, низ и друго число. След това създаваме променлива „резултат“, където се извиква функцията sample().

Вътре във функцията sample() задаваме израза „1:length(R_list)“, който показва векторите на индексите, през които да се взема проба. След това имаме аргумент „размер“, за да посочим броя на елементите, които да бъдат взети за извадка, който е „4“. Следователно „R_list“ генерира три произволно избрани елемента от списъка на „R_list“. Тъй като елементите в списъка на „R_list“ са от различни типове, получените елементи в „result“ също могат да бъдат от различни типове.

Резултатът представлява новия списък, който съдържа произволно подмножество от оригиналния списък:

Пример 5: Използване на функцията Sample() с аргумента Prob

Освен това имаме параметъра „prob“ на функцията sample(). Аргументът “prob” дава вероятността за избрания елемент във вектора. Обърнете внимание, че се приема, че всички елементи имат еднаква вероятност, когато не се използва аргументът „вероятност“.

моите_данни = ° С ( 31 , 99 , 5 , 24 , 72 )

проба ( моите_данни , размер = 10 , замени = ВЯРНО ,

вероятност = ° С ( 0,5 , представител ( 0,1 , 4 ) ) )

Тук елементите на числовите вектори се отнасят към „my_data“. В следващата стъпка извикваме функцията sample(), където „my_data“ се предава на произволно избрани 10 елемента от нея. След това се дефинира аргументът „размер“, който указва, че стойността за произволен избор трябва да бъде с размер „10“. След това присвояваме „TRUE“ на аргумента „replace“, което означава, че всеки избран елемент се заменя във вектора, преди да изберете следващия. Третият аргумент, който е дефиниран във функцията sample(), е „prob“, който определя вероятността всеки елемент във вектора „my_data“ да бъде избран. Вероятността на първия елемент е зададена на „0,5“. За останалите четири векторни елемента вероятността е „0,1“.

Следният изход се извлича с най-високата вероятност за първия елемент във векторите, както се очаква:

Пример 6: Използване на функцията Sample() за изобразяване на барплота

И накрая, функцията sample() се използва за конструиране на барплота в R за визуализиране на разпределението на категориална променлива с дадено вероятностно разпределение.

примерни_данни = ° С ( 1 , 2 , 3 )

барплот ( маса ( проба ( примерни_данни , размер = 500 , замени = ВЯРНО , вероятност = ° С ( .30 , .60 , .10 ) ) ) )

Тук, след като дефинираме „sample_data“ с вектора на целочислена стойност, ние генерираме барплота чрез внедряване на функцията sample(). Първо, извикваме барплота, която извиква функцията table(), за да създаде честотна таблица на получената проба. След това указваме функцията sample() в рамките на функцията table(), където произволна извадка с размер 1000 се извлича от вектор от цели числа от 1 до 3. След това аргументът „prob“ се използва за указване на вероятността за избиране на всяко цяло число .

Както можем да видим сега, барплотът се изобразява по следния начин с трите ленти, по една за всяко цяло число, а височината на лентите е свързана с цялото число, което се среща в извадката:

Заключение

Видяхме как работи функцията sample() с различни примери. Функцията sample() се използва с различни аргументи, когато примерните данни са задължителни, а всички други аргументи са незадължителни и се извикват при специфични случаи. Функцията sample() обаче е полезна при статистически анализи или при работа с големи набори от данни.