Какво представляват типовете данни на Amazon Redshift?

Kakvo Predstavlavat Tipovete Danni Na Amazon Redshift



Amazon Redshift е облачно решение, предлагано от AWS, което изпълнява целта на склад за данни. Складът за данни е голямо пространство в облака, което съхранява огромни количества данни. Разликата между хранилището на данни и базата данни е, че първото съхранява не само текущи данни, но и пълната история на данните.

Тази статия ще научи за Amazon Redshift от AWS и типовете данни, които тази услуга поддържа.







Какво е Amazon RedShift?

Това е облачно решение за съхранение на данни, което се основава на „PostgreSQL“ . Той използва технология, наречена „Масивна паралелна обработка (MPP)“ за обработка на петабайти данни със светкавични скорости. Това осигурява лесно решение за прогнозиране в реално време въз основа на исторически данни и решения за поточно предаване.



Следната фигура показва работния механизъм на Amazon Redshift:







Това графично обяснение на това как работи Amazon Redshift е много просто и ясно. Той ни дава информация за това как данните се извличат и обработват допълнително, за да генерираме резултати и да създаваме приложения, управлявани от данни.

Архитектурата на хранилището за данни на Amazon Redshift може да се види и на фигурата по-долу:



Сега ще се насочим към употребите и функциите на тази услуга.

Характеристика

Както вече споменахме, Amazon Redshift е базиран на PostgreSQL и използва технология, наречена Massively Parallel Processing, която му позволява да обработва петабайти данни за нула време. Следователно Redshift предлага голям брой функции и приложения. Някои от тези функции са посочени по-долу:

  • Сигурност на данните и криптиране.
  • Бизнес анализ.
  • Поддръжка на приложения, управлявани от данни.
  • Прогностичен анализ.
  • Автоматизирано повторение на задачите.
  • Едновременно мащабиране на данни.
  • Съхранение на данни.

Някои допълнителни функции на тази услуга могат да се видят на фигурата по-долу:

Това бяха повечето функции, които Redshift предлага, а сега ще преминем към типовете данни, поддържани от тази услуга.

Типове данни

Amazon Redshift е решение за съхранение на данни с голям брой функции. Поддържа както структурирани, така и неструктурирани типове данни. Тъй като е базиран на PostgreSQL, данните могат да бъдат манипулирани чрез прости SQL заявки.

Сега възниква друг въпрос, т.е. как тези формати на данни се различават един от друг? Нека обсъдим тези два формата на данни.

Структурирани данни

Силно форматиран тип данни, който лесно се превежда от алгоритми за машинно обучение, се нарича структурирани данни. SQL база данни работи със структурирани данни. Структурираните данни са в таблична форма като данните, използвани от релационни бази данни

Една от широко използваните SQL системи за управление на бази данни е MYSQL. Архитектурата му може да се види по-долу на дадената фигура:

Неструктурирани данни

Неструктурираните данни са с по-малко шаблони и формати, като например данните, използвани в нерелационни бази данни. MongoDB е известна нерелационна база данни. SQL заявките не работят с нерелационни бази данни, така че тези бази данни се наричат ​​още NoSQL бази данни.

Както вече споменахме, MongoDB е неструктурирана система за управление на база данни и нейната архитектура може да се види по-долу на дадената фигура:

Преминахме през двата основни типа данни, използвани в базите данни, и сега ще се насочим към действителните типове данни, които се поддържат от Amazon Redshift. Тези типове данни са:

  • Числени данни
  • Данни за символи
  • Данни за дата и час
  • Булеви данни
  • HLLSKETCH Данни
  • СУПЕР данни
  • Данни за ЗАМЯНА

Нека обсъдим тези типове данни:

Числени данни

Този тип данни се обяснява сам по себе си. Той поддържа данни, които са под формата на цели числа, десетични знаци, плаваща запетая и други цифрови типове данни.

Характеристиките на целочислен тип данни могат да се видят на фигурата по-долу:

Десетичният тип данни съхранява данните въз основа на прецизност от потребителя. Характеристиките му са както следва:

Данни за символи

Типовете данни CHAR и VARCHAR попадат в категорията типове данни, базирани на знаци. NCHAR и NVARCHAR също са символни типове данни. За разлика от CHAR и VARCHAR, тези два типа данни съхраняват символи Unicode с фиксирана дължина. Нека разгледаме свойствата на тези типове данни, като например:

  • CHAR, CHARACTER, NCHAR имат диапазон от 4KB.
  • VARCHAR, NVARCHAR има диапазон от 64KB.
  • BPCHAR има диапазон от 256 байта.
  • TEXT има диапазон от 260 байта.

Данни за дата и час

Типовете данни за дата и час са ДАТА, ВРЕМЕ, TIMETZ, TIMESTAMP, TIMESTAMPTZ. Функционалните възможности на тези типове данни са както следва:

  • DATE просто съхранява календарни дати.
  • TIME съхранява времето без препратка към която и да е часова зона. По подразбиране е UTC.
  • TIMETZ съхранява времето по отношение на часовата зона. По подразбиране е UTC както в потребителските, така и в системните таблици.
  • TIMESTAMP включва не само час, но и дати. По подразбиране е UTC както в потребителските, така и в системните таблици.
  • TIMESTAMPTZ включва не само час, но и дати. По подразбиране е UTC само в потребителските таблици.

Булеви данни

Булевият тип данни е двоичен тип данни, което означава, че има само две стойности. Таблицата с характеристиките за булев тип данни е дадена по-долу на фигурата:

HLLSKETCH Данни

Този тип данни се използва за съхраняване на скици. Червеното отместване може да представя скиците в разредена или плътна форма. Скиците започват като оскъдни и постепенно стават плътни, когато плътният формат осигурява повече ефективност, като следвате връзката.

СУПЕР данни

Този тип данни се занимава с неструктурирани данни, които могат да бъдат под формата на масиви, вложени структури или JSON. Няма модел или формат на данните. Потребителите могат да проучат повече информация, като навигират по връзката.

Данни за ЗАМЯНА

Този тип данни също съхранява знаци. Дължината обаче е ограничена. Amazon Redshift позволява прехвърляне на VARBYTE данни във всеки тип цяло число или знаков тип. За да получите повече информация за този тип данни, следвайте връзката по-долу.

Това е всичко за Amazon Redshift и типовете данни, които поддържа.

Заключение

Amazon Redshift е услуга на AWS, която в основната си форма служи за целите на склад за данни, но е много мощно и функционално решение за анализи и прогнози. Тази статия обсъжда Redshift и типовете данни, които поддържа. Тези типове данни бяха обяснени накратко заедно с техните характеристики.