![]() |
#11 |
Модератор
|
Ладно. Давайте для начала разберемся что такое "BigData" и откуда она взялась.
Big Data - это не просто "много данных". Это, в первую очередь, слабоструктурированные и распределенные данные. В этом их основное отличие. Откуда она пошла? Из поисковых систем - первый релиз сделали специалисты Yahoo, потом эту инициативу подхватили Google, поддержав тот самый Hadoop. Вот уже где много слабоструктурированной (тексты, форумы, музыка, видео и т.д.) и, тем более, распределенной информации. И, да - хранение, обработка, индексирование и быстрый поиск - очень важная для них задача. Является ли миллиард чеков "Большими Данными"? Нет. А сто миллиардов, даже если они побиты по 10 базам? Тоже нет. Потому что выдача запроса от non-sql поисковой системы - это выборка с определенной релевантностью. Т.е. если вы в реляционнку подадите запрос "Дай-ка, мне дорогая, чек №1000000" (Select * from bills where bills.billid == "1000000") - вы получите 1 чек с номером 1000000. И если вы ее попросите "А теперь дай-ка, мне дорогая, чеки с суммой покупки более 10 000 000" (Select * from bills where bills.amount >= "10000000") - вы получите все чеки с суммой покупки более 10 млн. А вот если вы первый запрос пошлете в Non-SQL, результат может Вас сильно удивить, так как кроме чека с номером 1 000 000 у вас будет "Как получить 1 000 000 подписчиков на Youtube", "Как украсть миллион", "1000000 рецептов борща" и еще какой-нибудь "How to earn you first million". Да, а чека, кстати, там может и не быть. Или быть далеко не первым в выдаче. Конечно, чем лучше профилированны и протегированны данные, тем релевантнее будет выборка. А задач много. И не только в соцсетях и телекоме. Но и вполне себе в ритейле. С Уважением, Георгий |
|
|
За это сообщение автора поблагодарили: mazzy (2). |
Теги |
big data |
|
Опции темы | Поиск в этой теме |
Опции просмотра | |
|