Андрей Расийски, Телепоинт: Големите данни са основа за бизнеса на бъдещето.

17.07.2023

Глобалният пазар на големи данни и анализи е на стойност 274 милиарда долара. Всеки ден в световен мащаб се генерират около 2,5 квинтилиона байта данни, в резултат на което към днешна дата в цялата цифрова вселена има над 44 зетабайта данни. 70% от тях са генерирани от потребители.

Разходите на крайните потребители за изчисления в облака възлизат на около 500 млрд. долара годишно.

Всички тези статистики на някои от водещите анализаторски компании недвусмислено показват, че големите данни не само са в основата на развитието на технологии на бъдещето като изкуствения интелект, но също така играят ролята на катализатор за цифровата трансформация на бизнеса.

Но какво точно представляват големите данни и защо се очаква да играят основна роля за еволюционното развитие на голяма част от индустриите? Какви са предизвикателствата, които големите данни поставят пред компаниите, преди да се превърнат в източник на конкурентни предимства? Къде живеят големите данни и какви са изискванията за тяхното съхранение и обработка? Отговорите на тези въпроси дава Андрей Расийски.

Андрей Расийски има две специализации по цифрова стратегия и иновации в Масачузетски технологичен институт (MIT) и магистърски степени - по бизнес администрация от IE Business School и по компютърни науки от Нов български университет (НБУ).

В последните години един от основните технологични термини е „големи данни“. Какво се крие зад него?

Този термин описва структурирана, полуструктурирана или неструктурирана информация, която се генерира от работата на различни индустрии и има различна стойност по отношение на начина, по който се прави един бизнес. Има компании, за които данните са много важни, има и такива, които просто ги генерират, но не ги използват толкова.

Стандартната дефиниция за „големи данни“ включва т.нар. 3V – volume (обем), variety (разнообразие), velocity (скорост, с която данните се генерират, съхраняват и обработват). Самите данни също имат свойството да генерират нови данни. Веднъж генерирани, определени данни се възпроизвеждат и се получава експоненциален процес на натрупване.

През последните години големите данни са навсякъде около нас. Те се генерират от почти всяка една човешка дейност и могат да бъдат както проблем с нуждата от съхранение, така и предимство, ако се анализират.

Какви са тенденциите в тази технологична сфера?

Големите данни са свързани с един феномен, наречен цифрова икономика или икономика на битовете, който възниква на базата на комбинация на три технологични групи – машините, платформите и разпределеното знание.

В случая термина „машини“ се използва като съвкупно понятие за всякакъв вид съвременни технологии – изкуствен интелект, 3D принтиране, дронове, невронни мрежи и т.н. Вторият стълб – платформите, включва всички бизнеси, които използват платформени бизнес модели. Пример за такъв е Uber. 

Идеята на този тип платформи е да съберат на едно място търсенето и предлагането и да ги предоставят като услуга. В случая с Uber компанията свързва хора, които търсят превоз, с други, които искат да работят като таксиметрови шофьори.

Друг пример за подобен бизнес модел е Airbnb. Има много хора, които отдават апартаменти временно или дългосрочно под наем, има и такива, които търсят да наемат. Те се свързват през платформата и едните получават услугата от другите. В резултат на това Airbnb има по-голяма пазарна капитализация от която и да е световна хотелска верига в момента, а нямат нито един хотел. 

Това е феноменът на цифровата икономика – платформените бизнес модели позволяват създаването на бизнес, който не притежава активи в класическия смисъл на думата, но е толкова мощен, че надминава традиционните представители на сектора си.

В момента 5 от първите десет компании по пазарна капитализация са базирани на платформени бизнес модели (това далече не беше така преди 20 години). Те са изключително мощни и трансформират цялата икономика и начина, по който се прави бизнес.

Под разпределено знание пък се има предвид процес, който не разчита на експертизата на една компания, а на събирането на малки количества информация от милиони хора в дадена страна, регион или локация, която да нарисува пълната картина. Концепцията е същата като при торентите и се нарича crowdsourcing. 

Тези направления са в основата на цифровата икономика, но всяко от тях има аналог в класическата. На машините аналог е човешкият разум, на платформените бизнес модели – продуктите и стоките, които хората произвеждат, а на разпределеното знание – централизираното знание, тъй като всяка една компания се стреми да създаде такова за това как прави бизнес.

Цифровата и класическата икономика не са във война. Те се допълват и се развиват, работят заедно за това човечеството да върви напред, а големите данни са хранителната среда за цифровата икономика. За ChatGPT например големите данни са това, което е за малкото дете обкръжаващия го свят. 

По друг начин казано, няма цифрова икономика без големи данни.

Как всички тези големи данни помагат на бизнеса?

Ако съвременните бизнеси искат да участват в цифровата икономика, те при всички случаи трябва да използват големи данни. Без да бъдат в състояние да възприемат, анализират обработват и генерират големи данни посредством някоя от тези три групи технологии, те няма как да участват в нея.

Класическата икономика или икономиката на атомите възниква паралелно с възникването на човешката цивилизация. Но тази на битовете започва с появата на компютрите и интернет, което дава началото на генерирането на големите данни. В нейното сърце стои т.нар. цифрова стока, без която също не може да има цифрова икономика.

Всяка една стока от тази група трябва да отговаря на три основни характеристики – да е перфектна (всяко едно копие да е напълно идентично с останалите), да може да се разпространи мигновено и разходите за нейното възпроизвеждане да са близки до нула. 

Класически пример за цифрова стока са софтуерните продукти и MP3 файловете, докато аналоговите продукти не отговарят на тези изисквания.

Ако един бизнес иска да навлезе в цифровата икономика задължително трябва да използва данните като хранителна среда и да дефинира цифровата стока, която е в основата на неговия бизнес модел. Именно данните помагат за изграждането на тази дефиниция.

Кои са най-високо интензивните индустрии по отношение на данните и какви нужди поражда този интензитет за тях?

Под индустрии с интензивно използване на информация и данни се разбират такива, които генерират огромни количества данни, които ги използват интензивно и за които загубата на данни ще бъде критична от бизнес гледна точка. Анализът, който направихме в „Телепоинт“, базиран на класификацията на ОИСР, извежда сред лидерите целия сектор, свързан с ИКТ – телекоми, софтуерни компании, и т.н.

Финансовият сектор също е високо интензивна индустрия, защото там се генерират огромни обеми от данни. 

Трети пример е здравеопазването, където има включително регулаторни изисквания, които задължават лечебните заведения да пазят събираната информация за определен период от време. 

Всички маркетингови проучвания, бизнес услугите, рекламата също попадат в групата на индустриите с висок интензитет на използването на данни.

Примери за обратното са селското стопанство и добивната индустрия, където също се генерират данни, но не в такъв мащаб.

По отношение на България, според нашите анализи, около 24% от българската икономика е с интензивно използване на големи данни. В това число влизат телекомуникациите и ИКТ, производството на машини и оборудване, търговията на едро и дребно, ремонтните дейности, финансовите услуги, здравеопазването и др.

Колокационните и облачните услуги са основно решение на предизвикателствата, които поставят големите данни пред бизнеса. Какви предимства дават те спрямо локалните центрове за данни?

Центровете за данни са местата, където големите данни живеят. Те се генерират в интернет, но трябва да се съхраняват някъде и бизнесите имат различни подходи към това. Най-генеричният подход е – имате нужда да съхранявате данни, организирате си локален център, изграждате си съответните условия – непрекъсваемо електрозахранване, дизелови генератори, системи за климатизация, системи за пожарогасене, сигурност и т.н.

Другият подход е да се обърнете към такива като нас, които правят инсталации, събиращи стотици хиляди сървъри и шкафове за сървъри. 

Разликата идва от икономията от мащаба. Когато ние го правим, го правим за голямо количество оборудване, докато една банка например би го направила за 30-40 шкафа за сървъри (това е количеството, нужно на финансовите институции у нас). Разликата в себестойността на един шкаф за нас и за тях е над три пъти – нашата е три пъти по-ниска от тяхната.

Освен това, след като се направи първоначалната инвестиция, има разходи и за поддръжка. 

Нашият опит сочи, че всичко, което е под 100 шкафа като инвестиция, не е рентабилно. От тази гледна точка, всеки един бизнес, който решава да си прави нещата сам, трябва да знае, че проекти под този мащаб са нерентабилни и е много по-добре да използва услугите на външен доставчик като нас, защото ще получи на високо професионално ниво всички тези системи с гарантирана поддръжка.

Друг пример са мобилните оператори. За софтуера на една мобилна мрежа са нужни около 30 шкафа, т.е. няма много компании, които имат нужда от 100 шкафа. Това е и смисълът на съществуването на колокационни центрове – събирате всичко на едно място, правите свръхпрофесионално обслужване, поддръжка и системи и потребителите получават нещо, което трудно биха могли да направят сами от гледна точка на качествените характеристики, а от икономическа перспектива никога не биха постигнали рентабилност на тази си инвестиция.

Какви са изискванията към един доставчик на подобни услуги? С какво трябва да разполага той, за да бъде максимално полезен за клиентите си? 

Според класификацията на видовете колокационните центрове има шест групи, като в последните две – 5 и 6, влизат единствено центровете на технологични гиганти като Meta и Google. Масово разпространените центрове се разделят в четири категории, а категоризацията зависи от фактори като гарантираното време за работа на системите. 

Когато има сървъри една компания и си ги поддържа сама, без да има специални изисквания, тя е индустриален потребител на елeктроенергия в общия случай и взима електрозахранване от една подстанция. Но ако стане авария, за да могат да продължат да работят сървърите, трябва да има UPS, който да поеме захранването, а през този интервал от време да се включи дизеловия генератор. 

За да не е така, трябва да имате връзка към втора подстанция, както е изискването при болниците например.

Показателят за достъпност на услугата се разпределя в няколко категории – най-ниската е 99,7% на годишна база. При центровете за данни от тип 4 показателят е 99,995% - или средно по-малко от 26 минути на година някакви прекъсвания. 

При категория 1 са над 28 часа на година, което е огромна разлика.

Този пример е същият и когато става дума за останалите системи, като климатизацията например. 

В същото време, колкото по-висока е категорията, толкова по-високо е нивото на предоставяните услуги, но и на инвестицията. А, както стана ясно вече, тя може да бъде рентабилна само при достатъчно голям обем. И тъй като повечето бизнеси не могат да го осигурят, започват да правят компромиси с качеството и категорията.

По този начин вместо една банка например да има категория 4 колокационен център, тя има категория 2 локален център за данни и рискува над 20 часа спиране на услугите годишно или ако този център все пак е 4 категория то инвестицията е голяма и нерентабилна.

Как се развива пазарът на колокационни услуги в България? Осъзна ли българският бизнес стойността им?

До голяма степен – да, но и тук зависи от конкретната индустрия. ИКТ компаниите много бързо разбраха за какво става въпрос, защото самите те използват много интензивно данни. Здравеопазването и финансовите услуги също започват да разбират предимствата на колокационните услуги, както и производителите на автомобилни части например.

Иначе пазарът на колокационни услуги сам по себе си е от порядъка на 30 млн. евро приходи на годишна база, но ако включим и този на всякакви облачни услуги, достига над 600 млн. евро. За сравнение, пазарът на телекомуникационни услуги е над 1,5 млрд. евро. 

Тоест, краткият отговор е – пазарът има още много да се развива. А това, че секторът е в развитие, означава, че ще има растеж. До момента виждаме ръст от около 17% на година, но от създаването си „Телепоинт“ например регистрира двойни на средните пазарни темпове. 

В България съществуват 12 компании, които предоставят подобни услуги, и има изградени 22 центъра за данни с различни категории.

Тъй като това не е регулиран бизнес, компаниите нямат задължение да предоставят данни на администрацията, а оценката на пазарните дялове се прави косвено, на базата на декларираните от доставчиците данни за колокационната площ и количеството на осигуреното захранване. Статистиката поставя „Телепоинт“ на първо място, което е обяснимо, тъй като компанията е от първите на пазара, с около 1/3 пазарен дял.

Какво е бъдещето на големите данни и на „Телепоинт“ в частност?

Първата машинна ера, или по-известна като Индустриална революция, е мултиплицирала мускулните усилия на хората – ако преди е трябвало нещо да се произвежда с огромни физически усилия, след изобретяването на машините силата, която е употребявана в производството, не е само човешката.

С навлизането си компютрите и интернет мултиплицират менталните усилия на човека и процеса на измисляне се случва по-бързо и по-ефективно. Те дават и възможност за появата на големите данни – в момента за няколко часа в интернет се генерира повече информация, отколкото за цял човешки живот по времето на Шекспир. 

С тях започва и втората машинна ера, а днес бизнесът може да избира между това да остане старомоден и това да влезе в икономиката на битовете, повишавайки конкурентоспособността си. Възникването на този тип икономика променя целия начин, по който функционира човешкото общество и цялата цивилизация. И тези, които не са в състояние да се адаптират, ще изчезнат по чисто еволюционни причини.

Така че големите данни освен че са хранителна среда за цифровата икономика, трансформират и начина, по който се прави бизнес. Вече един мениджър не може да е сигурен, че взима правилно решение, ако то не се базира на големи данни.

Що се касае до „Телепоинт“, без компании като нас големите данни можеше да ги няма в тези обеми. Ние продължаваме да инвестираме в колокационни центрове, но гледаме и в бъдещето. 

В съхраняването и обработката на данни също има тенденции. Едната е да се използват централизирани локации. Другата е свързана с периферните изчисления, когато данните се обработват и съхраняват в хиляди крайни точки. Затова и ние водим разговори с няколко компании, които се занимават с обслужването на подобна инфраструктура. 

Друго направление за развитие за нас е разширяването на предлагането на облачни услуги. Те са много популярни сред бизнеса, защото вместо една компания да инвестира в сървъри и дискове, купува облачна услуга, която предлага виртуализиран сървър, виртуализиран диск и т.н. 

Увеличава се и търсенето на хибридни облачни услуги, които комбинират водещи облачни платформи като тези на Microsoft и Amazon с частна виртуална среда. Ние инсталираме съответното оборудване на клиента, виртуализираме го и той ползва виртуалната среда вместо да купува физическите машини. 

С други думи казано, колокацията е базовата инфраструктура, върху която се опитваме да надграждаме с други услуги с висока добавена стойност. 

Към днешна дата „Телепоинт“ разполага с три центъра за данни на територията на страната – два в София и един резервен в Монтана. Те са свързани на базата на високоскоростна DWDM мрежа, която разполага с капацитет 96 x 100 гигабита за пренос на данни от точка в точка. 

Около „Телепоинт“ има изградена група партньорски компании, като идеята е около основния бизнес, свързан с колокационни и облачни услуги, да има други организации, които да допълват портфолиото. Целта е когато човек донесе оборудването си в колокационния център, да получи допълнителните услуги, от които има нужда – свързаност към интернет и други доставчици, защита срещу хакерски атаки и т.н. Да предлагаш колокационни услуги не е достатъчно. Стремим се да обхванем цялата екосистема.