Железо и провода :  "Ячейки"
Обсуждение всего "электронного", что не относится к мобильной связи. Компьютеры, прочее электронное оборудование, провайдеры стационарного доступа в интернет и т.д. Администратор форума - Wireless 
[ Ячейки ] [ Билайн против МТС - Мегафорум - Tele2 ] [ Виртуальные операторы ] [ Устройства мобильной связи ] [ Железо и провода ]
[ Мобильная связь: покрытие и качество ] [ Барахолка ] [ Клуб "Старые Сell-ки" ] [ 3G против 4G - архив 2003-13 ]
[ "На чердачке" - блог секретов мобильной связи ] [ Клуб "Курилка" ] [ Участники ] [ Правила поведения ] [ Нарушители ]
[ Попали на Ячейки из Яндекс или Google? Зарегистрируйтесь и спросите! ]

[ new! Новый клип выложен 08.01.2024 Авторские рок-баллады от основателя Ячеек. Смотрите клипы, подписывайтесь. ]



ОбъявленияПоследнее сообщение
ОбъявлениеНе складывается у меня с сяоми, никак. Поэтому, предлагаю Сяоми редми 9т. (+)18-04-2024 02:29

Размещено пользователем : барабулька ()
Зарегистрирован: 14 годов назад
Сообщения: 4,448
Ранг: Элитарий - монстр
Дата: 11-06-2014 20:50

До отечественной ИТ-индустрии докатился мировой бум больших данных. Об этих технологиях говорят все, отдельные компании уже их внедряют, но большинство предприятий пока только присматривается и ждет (+) (Горячая новость)(URL)


... результатов первых проектов. Технологии, находящиеся на пике ожиданий цикла Gartner, и манят большими возможностями, и настораживают новизной. Теме больших данных была посвящена прошедшая 4 июня 2014 г. конференции «Big Data – технология будущего», организованная CNews Conferences и CNews Analytics. Эксперты ИТ-рынка обсудили, что можно считать большими данными и какие перспективы открываются бизнесу и государству с началом применения этих технологий.

Что такое большие данные? Поиск ответа на этот вопрос напоминает индийскую притчу о слоне и семи слепцах. В такой аллегорической форме представил тему больших данных Виктор Булгаков, руководитель департамента управленческой информации компании «Вымпелком». Следуя логике иносказания, эксперты, соприкасаясь с феноменом лишь частично, получают очень разное представление о его сущности, к тому же далекое от истины. Аналогия со слоном здесь не случайна: изображение этого животного стало эмблемой Hadoop –системы, которую считают основополагающей технологии больших данных.

Терминологическая неясность

Для отнесения технологий к стеку больших данных аналитики Gartner требуют соблюдения трех условий: большого объема, высокой скорости обработки и разнообразия данных – volume, velocity, variety (знаменитые три «V»). Эксперты из числа маркетологов полюбили добавлять сюда свои «V». Кто-то говорит еще о достоверности (veracity), другие добавляют, что технологии больших данных непременно должны приносить пользу бизнесу (value). Так или иначе, но участников конференции не удовлетворили эти определения. При обсуждении ряда реализованных российских проектов они так и не пришли к единому мнению, в каких случаях примененные подходы и инструменты можно отнести к технологиям больших данных, а в каких – нельзя. Вопрос, что считать большими данными, нашел самый большой отклик аудитории, но так и остался открытым.

Мысль, буквально висевшую в воздухе, озвучил Александр Аникин, руководитель аналитического отдела Wikimart (компания использует Hadoop). «Большие данные придумали вендоры, чтобы продать BI тем, кто еще не купил, а если уже купил, то чтобы продать во второй раз», – заключил спикер. Однако очевидно – и с этим фактом согласились все присутствующие, – что новые технологии дали возможность анализировать данные, которые до недавнего времени было невозможно обрабатывать за приемлемые деньги и в сжатые сроки.

С появлением технологий распределенной обработки данных стало возможным решать задачи, непосильные классическим BI-инструментам. Бизнес смог осуществить массовую кастомизацию своих услуг, анализировать информацию в реальном времени и оперативно реагировать на изменения рынка.

Бум больших данных порожден одновременно несколькими тенденциями. По мере все более глубокого проникновения интернета, с распространением социальных сетей, электронной коммерции существенно растет объем доступной для анализа информации о пользователях, действующих и потенциальных клиентах. Машины, хоть и не сидят в Facebook, но создают динамично растущий интернет вещей при помощи датчиков и сенсоров всевозможные устройства – и это вторая тенденция. Далее, цены на ИТ-инфраструктуру падают, свой вклад в эту тенденцию делают и облачные технологии. По данным известного венчурного фонда KPCB, на протяжении последних 13 лет стоимость вычислений ежегодно снижается на 33% и хранения – на 38%. И наконец, заметно совершенствуются технологии глубинной аналитики.

Родина больших данных

Технологии больших данных зародились в интернет-проектах. Большие данные – это их плоть и кровь и источник дохода. Возможности антиспама и таргетинга делают большие данные по сути бизнесообразующими для компаний, имеющих «прописку» в глобальной сети. Они одними из первых начали их собирать, анализировать и на них зарабатывать. «Мы столкнулись с большими данными и начали с ними работать очень давно, еще в 2002 году, когда и термина такого не было. Наверное, поэтому мы его не очень любим, – поделился Александр Горный, директор по информационным технологиям Mail.Ru Group. – Ни с появлением Hadoop, ни с популяризацией термина «большие данные» в нашей стратегии работы с данными ничего принципиально не поменялось», – отметил он.

Анализ больших данных помогает Mail.Ru Group – одной из крупнейших интернет-компаний в мире – предоставлять своим пользователям более качественный сервис, то есть кастомизированный, индивидуальный, учитывающий личные предпочтения. Анализ информации о пользователе, его поведении в сети помогает искать друзей в «Одноклассниках», предлагать интересные новости, показывать релевантную рекламу. Большие данные выводят третирование на новый уровень и позволяют выделять самые неожиданные сегменты для интернет-рекламы. Например, можно вычислить пользователей, которые с большой долей вероятности курят или не смотрят телевизор. Кроме того, большие данные помогают Mail.Ru Group тестировать новые элементы интерфейса и оценивать их эффективность, а также анализировать поведение людей на других сайтах в рамках сервиса «Счетчик».

Евгений Буслов: Использование больших данных в телекоме дает прирост выручки в 12%
Новые технологии анализа данных произвели своего рода революцию в подходах к ранжированию результатов поиска. Если более 20 лет назад главным критерием было наличие ключевых слов на странице, потом – число ссылок на сайт, то сейчас основное значение имеет оценка ресурса пользователями, так называемое социальное ранжирование: число «лайков» и время, проведенное на странице. Интересно и то, что анализ данных позволяет «определять карму пользователей», то есть отличать роботов от людей. Это довольно сложно, так как, по словам эксперта, роботы стараются маскироваться под людей, а люди бывают похожи на роботов. Приходится анализировать предыдущее поведение пользователя, поведение его друзей, поведение людей из этого региона – реализовать все возможности, чтобы отделить одних от других.

Отвечая на вопрос об используемых технологиях, Александр Горный рассказал, что для анализа больших данных в компании применяются технологии собственной разработки. При этом при интернет-поиске и таргетировании рекламы задействуется Hadoop. Спикер считает, что у успешного проекта больших данных должна быть измеримая цель. Пустое вычисление какого-либо параметра эффекта не принесет.

Инфраструктура анализа больших данных интернет-магазина

В интернет-магазине Wikimart большие данные используются в первую очередь для формирования рекомендаций пользователям. Александр Аникин сравнивает этот инструмент с рубильником: включаешь – выручка растет, выключаешь – падает. По его мнению, Hadoop дарит хорошую возможность небольшим компаниям, не имеющим больших ИТ-бюджетов, повысит эффективность бизнеса. Однако некоммерческие версии Hadoop имеют ряд недостатков и, как следствие, требуют участия дорогостоящего квалифицированного персонала.

В соответствии с мировой тенденцией в компании Wikimart подразделение аналитики подчиняется напрямую главе компании. Александр Аникин посетовал, что у директоров всегда есть желание «куда-нибудь засунуть» аналитику, однако в Wikimart помогло мнение члена совета директоров, возглавляющего аналитическое подразделение в LinkedIn: он убедил, что эти инструменты необходимы. С этим подходом согласен Алексей Благирев, директор по развитию систем аналитики и отчетности банка «Открытие». Он убежден, что начинать проекты по большим данным целесообразно с выделения аналитики в отдельный департамент.

Другой интернет-проект – доска объявлений Avito – использует частично опенсорсные решения для анализа больших данных. Одной из самых актуальных задач для Avito является очистка содержания сайта от спама. Конвейер очистки контента позволяет блокировать порядка 35% сообщений в день. Модель проводит скоринг объявлений и готовит выборку к рассмотрению модератором.

Схема конвейера очистки содержания интернет-доски объявлений

Разработка аналитической витрины для руководства, отражающей рентабельность ресурса, – цель проекта больших данных в интернет-кинотеатре «ВебТВ». Как рассказала ведущий аналитик компании Елена Рубец, аналитика в режиме реального времени потребовалась для принятия оперативных решений о неэффективности рекламных площадей. Проект реализуется стандартными инструментами Google Analytics. Этот факт вызвал спор в аудитории по поводу того, можно ли отнести этот проект к большим данным.

Большая аналитика

Наличие доступных рынку историй успеха аналитики считают одним из важных факторов, способствующих распространению новых технологий. Уникальный проектный опыт был представлен на конференции Алексеем Бедновым, архитектором Big Data-решений AT Consulting, и Виктором Булгаковым, руководителем департамента управленческой информации компании «Вымпелком». Эксперты осветили вопросы использования технологий больших данных в телеком-операторе для решения различных задач, как например: определение внутреннего оттока абонентов, фильтрация SMS-спама, повышение качества обслуживания клиентов, построение карт перемещения абонентов.

Алексей Беднов глубоко убежден в том, что для пилотных проектов, проверки гипотез следует пользоваться опенсорсными решениями, которые позволяют существенно расширить практику больших данных в компании, найти стоящие проекты, не инвестируя значительных средств. «Покупая вендорское решение, вы становитесь зависимы от разработчиков вендора – патчи, доработки, новые технологии приходят с задержкой. Стоимость проекта на MPP-платформе и Hadoop отличается в разы в пользу Hadoop», – рассказал эксперт.

По словам Виктора Булгакова, раньше компания «Вымпелком» не могла начать подобные проекты, так как при реализации аналогичного решения на реляционной базах данных срок окупаемости достигал 6-7 лет, а эффекта могло не оказаться. Сейчас задачи, от которых отказывались несколько лет назад, начали решать на Hadoop. На сентябрь 2013 г. было запущено 44 пилота, и их число постоянно растет, что Виктор Булгаков считает хорошим признаком, подтверждающим востребованность аналитики со стороны бизнес-пользователей. Здесь эксперт считает важным обеспечивать быстрый результат, который подогревает интерес бизнеса к проектам больших данных.

ИТ-ландшафт сотового оператора для анализа больших данных

Живое внимание аудитории привлек кейс, представленный Дмитрием Букановым, директором по ИТ компании «Коттон Вэй». Он рассказал, как индустриальная прачечная, предоставляющая услуги по аренде и профессиональной обработке текстильных изделий, оптимизирует свою деятельность при помощи анализа данных RFID-меток и отзывов в социальных сетях. Построенная система для анализа данных из транзакционных систем, информации о заказчиках и отзывов в интернет от конечных потребителей стала для компании средством познания своей деятельности и помогла лучше понять потребности заказчика. На основе полученных знаний специалисты компании разработали новые сервисы, научились управлять дефицитом и рассчитывать риски новых проектов.

Дмитрий Буканов, директор по ИТ компании «Коттон Вэй»: Если в поезде, в котором используют наш текстиль, вы заметили брак и написали об этом в Facebook, то еще до окончания путешествия вам заменят комплект и извинятся

«Если в поезде, в котором используют наш текстиль, вы заметили брак и написали об этом в Facebook, то еще до окончания путешествия вам заменят комплект и извинятся», – утверждает Дмитрий Буканов. Классическая OLAP-аналитика в этой ситуации не помогала понять причины произошедшего и устранять проблемы, сопоставлять данные, потому что они слишком разрозненные – причины событий нельзя установить. «Большие данные позволяют решать задачи, на которые OLAP не способен», – резюмировал эксперт.

Многие участники конференции признали, что сталкивались с проблемами передачи терабайтов данных. По оценкам экспертов, трафик облачных дата-центров вырастет в 6 раз с 2011 по 2016 гг., достигнув приблизительно 5 ЗБ. В условиях, когда развитие оптоволоконных и кабельных сетей обходится очень дорого, спектральное уплотнение существующих линий связи при помощи специализированного оборудования может стать хорошим решением, считает Долгушин Павел, начальник технического отдела «Зетталайн».

Больше – лучше?

По мнению Алексея Благирева, получать ценные знания из больших данных трудно и затратно. Эксперту больше импонирует концепция «умных данных» (Smart data), в соответствии с которой собираются лишь факты, необходимые для решения конкретных бизнес-задач. Алексей рассказал о планах создать сообщество бизнес-аналитиков совместно с HP. Проекты больших данных позволили снизить риск хищений в банке «Открытие» и предоставить бизнес-пользователям доступ к оперативной отчетности для быстрого принятия решений.

Иван Гуз, руководитель направления аналитики Avito, считает, что есть две крайности: загружать в хранилище все данные и потом думать, что с ними делать, или сохранять лишь те данные, которые кажутся полезными. Эксперт рекомендует использовать для анализа немного больше данных, чем может понадобиться.

Прошедшая конференция показала, что российский рынок больших данных находится на начальной стадии формирования. Участники рынка еще не определились, что считать большими данными. Идут первые пилотные проекты, до массового применения технологий дело еще не дошло. Однако интерес к этой технологии колоссален, и первые истории успеха подогревают этот ажиотаж. Аналитики ожидают, что 2014 год станет годом массовых внедрений больших данных. Как это обычно бывает, эта технологическая волна должна докатиться до России в ближайшие несколько лет.

Евгений Буслов: Использование больших данных в телекоме дает прирост выручки в 12%

Евгений Буслов, руководитель направления Big Data компании «Петер-Сервис», рассказал о том, какие задачи в телекоммуникационной отрасли решаются при помощи больших данных, как от этого выиграют абонент и оператор.

CNews: Для вас большие данные – это большой объем корпоративной информации или в том числе внешние данные?

Евгений Буслов: Когда мы говорим о больших данных, то подразумеваем любые доступные нам источники информации. Ведь прекрасно известно, что синергетический эффект от их использования дает именно извлечение новых знаний из всего того многообразия информации, что уже накоплено в компании. В текущих реалиях можно смело утверждать: чем больше у вас знаний, тем больше преимуществ.

CNews: Какие задачи телекоммуникационного оператора можно решить с применением технологий больших данных?

Евгений Буслов: Большие данные позволяют решать самые разнообразные задачи. Естественно, основное применение у телекоммуникационных операторов как в России, так и в мире – это активный маркетинг, борьба с оттоком клиентов, повышение их лояльности, построение каналов взаимодействия с абонентом, развитие ритейл-сетей.

CNews: Какие проекты в сфере больших данных вы осуществляете сейчас?

Евгений Буслов: Более чем двадцатилетний опыт компании «Петер-Сервис» позволяет выстраивать эффективные ИТ-решения, помогающие клиентам успешно реализовывать бизнес-задачи. Разработанный в компании каталог решений по анализу больших данных помогает нашим клиентам найти ответы на вопросы, формулируемые бизнесом и рынком. Ни для кого не секрет, что зарубежный опыт подобных проектов в телекоме уже сейчас дает порядка 12% прироста ARPU, то есть средней выручки в расчете на одного пользователя, в среднесрочной перспективе.

CNews: Является ли направление больших данных для вас стратегическим?

Евгений Буслов: Безусловно, большие данные – это наша предметная область, она растет и развивается за счет увеличения объема и многообразия данных и проектов по их анализу и монетизации. Компания «Петер-Сервис» активно не только развивает коммерческие проекты, но и делится информацией и знаниями с бизнес-сообществом. Мы провели уже две конференции, посвященные большим данным и их монетизации, и на подходе третья, которая состоится осенью 2014 года.

CNews: Что выиграет абонент от применения вами технологий больших данных?

Евгений Буслов: В первую очередь, абонент получает качественный сервис. Все текущие проекты в телекоме так или иначе направлены на повышение лояльности абонента за счет сокращения количества SMS-спама, роста релевантности продуктового предложения, гибкого управления услугами и предложениями.




До отечественной ИТ-индустрии докатился мировой бум больших данных. Об этих технологиях говорят все, отдельные компании уже их внедряют, но большинство предприятий пока только присматривается и ждет (+) (Горячая новость) (URL) < барабулька >   [1906]   11-06-2014 20:50
Форум BIG DATA 2019 = 27 марта 2019 (-) (URL) < барабулька >   [420]   24-03-2019 00:57
28 марта 2019 года в Москве CNews проводит конференцию «Эффективный ЦОД 2019» (+) (URL) < барабулька >   [400]   24-03-2019 01:01
По составу участников - туфта. Маркетинговое переливание и пустого в пороженне будет. (-) (IMHO)  < Oleg >   [397]   24-03-2019 04:25
Не хватает Мишани Слободина с биг дата (-)  < abc >   [406]   26-03-2019 16:41
России предсказали взрывной рост рынка больших данных 14.02.2019 | 21:33 (+) (URL) < барабулька >   [429]   12-03-2019 06:38
ИТ-решения снижают расходы банков на 20% (+) (URL) < барабулька >   [580]   13-10-2014 19:43
"роль консалтинговой компании здесь состоит в том, чтобы правильно определить потребность в технологии банков и других предприятий" = развести на деньги. (-) (IMHO)  < Oleg >   [584]   19-10-2014 20:46
обнаружил на ютубе кучу обучающих обзорных инфороликов о больших данных (-) (Совет) (URL) < барабулька >   [603]   11-06-2014 22:16
Осталось три дня до конференции, посвященной аутсорсингу и облачным ИТ-решениям для банков (+) (Горячая новость) (URL) < барабулька >   [640]   17-06-2014 17:51
Остается 1 день для регистрации участников конференции «Аутсорсинг и облачные ИТ-решения для банков: как применять наиболее эффективные технологии, оставаясь в рамках бюджета» (+) (URL) < барабулька >   [1339]   17-06-2014 17:53
Главное - чтобы банки, которые свалились к аутсосингу, а также "слили" всю свою кухню (=> данные клиентов) в облако к "дяде", стали бы известны... (-)  < Pago >   [567]   17-06-2014 23:15


Array
Sorry, only registered users may post in this forum. Только зарегистрированные пользователи могут писать в этом форуме.