Technologie  Deloitte živě 

Měsíčně stáhneme miliardy webových stránek, popisuje zakladatel Apify Jan Čurn

Služba, která nabízí extrakci dat z webových stránek – co si pod tím ale představit? „Jedním ze zákazníků firmy Apify je například americká nezisková organizace Thorn. Ti vyvíjejí produkt Spotlight pro policejní okrsky nebo FBI. Mají obrovskou databázi toho, kdo a kde nabízí sexuální služby – vše stažené z různých webů právě pomocí Apify. Jakmile je tedy někdo pohřešovaný, jsou schopni projít onu databázi a člověka v ní najít,“ popisuje službu zakladatel Jan Čurn. Apify měsíčně stáhne miliardy dat z webových stránek. A zřejmě velmi kvalitně – v programu Deloitte Technology Fast 50 získala společnost ocenění CE Tech Rocketship! jako jediná česká firma.

Pro začátek mi řekněte – čím se Apify přesně zabývá?

Apify je cloudová platforma, která umožňuje extrakci dat z webu a automatizaci procesů na webu. Cokoliv, co se dá udělat manuálně ve webovém prohlížeči, umožňujeme automatizovat.

Takže pokud si vaši službu objednám, co po vás vlastně budu chtít? Co mi dáte?

Těch možností je obrovská řada, ale dobrý příklad je e-commerce. Pokud něco prodáváte online, tak potřebujete vědět, co dělá vaše konkurence – jaké produkty a za jakou cenu nabízejí nebo jak se vyvíjí jejich portfolio v čase. Jedna z možností, jak to udělat, je nastavit robota, který projde webové stránky konkurentů, stáhne seznamy jejich produktů a cen, a vy si je pak můžete zanalyzovat a reagovat na ně. V této oblasti mimochodem provozujeme i neziskový projekt, který se jmenuje Hlídač shopů. Je to rozšíření do webového prohlížeče – jakmile jdete na stránku některého z největších českých e-shopů, tak vám Hlídač ukazuje přesný vývoj ceny produktu v čase, včetně skutečných slev.

Je to vlastně takový rešeršista.

Ano, přesně tak, ale e-commerce je pouze jedna z mnoha oblastí využití Apify. Další oblast jsou například sociální média, která typicky neposkytují takzvané API neboli Application Programming Interface. Apify vlastně umožnuje API-fikovat libovolné weby, které API nemají. Pokud potřebujete data o tom, jak lidé reagují na příspěvky různých firem a stránek, jak vašim konkurentům rostou followers, co zveřejňují za příspěvky nebo jak píší lidé o vaší firmě, tak ta data musíte stáhnout z webu.

Jaké další oblasti tedy ještě pokrýváte?

Další populární oblastí jsou data z internetových vyhledávačů a map. Ta se hodí pro rozvoj podnikání, marketing, vyhledání nových kontaktů nebo průzkum trhu. Je to obrovská škála věcí. Řešíme například cestování – data o dostupnosti a cenách ubytování na portálech o cestování nebo nabídky nemovitostí k prodeji nebo pronájmu na realitních webech. Další populární a rychle rostoucí oblast využití Apify je získávání dat pro umělou inteligenci, a to pro trénink modelů nebo jejich zásobování aktuálními daty z webu.

Apify v datech

  • Od roku 2015
  • Miliardy webových stránek měsíčně
  • Globální produkt
  • Polovina zákazníků z Ameriky
  • Kanceláře v bývalém ateliéru Vácslava Havla v Paláci Lucerna

Dokonce jsem se o vás dočetla, že Apify prý umí pomoct hledat pohřešované děti – jak to funguje? To unesené dítě by přeci únosce musel nejprve umístit na internet?

Jeden z našich zákazníků je americká nezisková organizace Thorn. Ti vyvíjejí produkt Spotlight a prodávají ho policejním okrskům nebo FBI. Funguje to tak, že mají obrovskou databázi toho, kdo a kde na webu nabízí sexuální služby, včetně fotek. Data z těchto webů získávají pomocí Apify. Jakmile je tedy někdo pohřešovaný, jsou schopni projít onu databázi a toho člověka najít. Často to jsou prý mladiství, kteří utečou z domova a pak takto skončí. Není to tak, že by všechny někdo držel násilím, i když smutných příběhů je tam mnoho. Jsme rádi, že můžeme pomoci udělat dobrou věc.

Jak vás to vlastně celé vůbec napadlo?

Firma vznikla v roce 2015 v rámci Y Combinator Fellowship – to jsme spustili online službu. Už ale předtím, zhruba od roku 2005, jsem na Matematicko-fyzikální fakultě s pár lidmi vyvíjel podobnou verzi této služby. Na jednom místě jsme sbírali data s nabídkami ojetých automobilů a pak je nabízeli na našem webu nazvaném najednommiste.cz. Projekt sice skončil v šuplíku, ale ozývali se nám lidé, kteří o takovou službu měli zájem. Potřebovali třeba data z e-shopů v Anglii, aby je v Česku mohli přeprodávat nebo seznam právníků v Itálii, aby jim mohli nabízet produkty. Viděli jsme v tom potenciál, tak jsme udělali nové a lepší online řešení, než bylo na trhu. Tím to celé vzniklo.

quote icon

„Trh v roce 2022 obecně ochladl, startupy a firmy najednou neměly peníze na investice a hledaly úspory. Propadl nám obrat, a tak jsme museli udělat zásadní změny.“

author name Jan Čurn, zakladatel Apify

S kolika webovými stránkami měsíčně nebo denně Apify pracuje, jsou to tisíce, miliony…?

Přesné číslo lze těžko říci, objem je v řádech miliard stránek měsíčně. Nedávno jsme na příklad pro jednoho klienta stahovali okolo miliardy stránek z celého arabského internetu, pro trénink jejich jazykového model pro arabštinu, takového „Arabic GPT“. Na celkovém zatížení našeho systému se to téměř neprojevilo.

Data na internetu jsou asi nekonečný vesmír, že?

Přesně tak. Často nás překvapuje, s čím za námi zákazníci přicházejí, jaká data získávají, a k čemu je pak používají. Třeba příklad zmíněného Thornu by nás nikdy nenapadl.

Vy se netajíte tím, že jste v roce 2021 zažili velký růst, pak ale přišlo utlumení – co se tehdy stalo?

Trh v roce 2022 obecně ochladl, startupy a firmy najednou neměly peníze na investice a hledaly úspory. Propadl nám obrat, a tak jsme museli udělat zásadní změny.

Hrál v tom roli covid?

Covid nás zejména díky růstu e-commerce a pumpování peněz do ekonomiky naopak vyhoupl. Najednou lidé kupovali všechno online, úvěry a venture kapitál byly levné, a tak firmy investovaly. Trh si myslel, že to takto zůstane, ale nakonec se vrátil na předcovidovou trajektorii. E-commerce představuje zhruba polovinu našeho obratu, a tak nás to také zasáhlo. Toto náročné období nás ale donutilo udělat ve firmě potřebné změny, snížit náklady, zlepšit focus – jasně si říct, co děláme, pro koho, a tedy také co neděláme.

Jak je na tom firma teď? Jak jste momentálně spokojeni s růstem firmy?

Od začátku tohoto roku jsme vyrostli přes 60 %, máme nyní rekordní obrat i profit. Spokojeni jsme, ale dále intenzivně pracujeme na tom, abychom rostli ještě rychleji. Potenciál k růstu je velký.

Co krize energetická a začátek ruské invaze na Ukrajině. Mělo to na vás dopad?

Většina našich zákazníků je ze západního světa, více než půl obratu máme z Ameriky, takže obchodně nás to příliš nezasáhlo, ale morálně a lidsky nás to samozřejmě zasáhlo velmi.

Když říkáte, že je půlka zákazníků z Ameriky, jaký je podíl českého trhu?

Podíl českého trhu je poměrně malý, je to jen pár procent. Primárně máme obrat z Ameriky a Kanady, v Evropě například z Německa, Belgie, Francie nebo Velké Británie. Ale je to tak, že hlavní je Amerika a pak dlouho nic.

quote icon

„Už od samého začátku jsme firmu stavěli jako globální softwarový produkt, nikdy jsme nebyli zaměření jen na Česko. A tím, jak jsme internetová služba, tak geografie nehraje roli, nemá to žádná specifika pro konkrétní země.“

Čím si to vysvětlujete?

Myslím si, že trh v Americe je vyspělejší, firmy tam daleko více inovují a investují. Nebojí se vyzkoušet nové postupy a koupit nové produkty, pokud je to může někam posunout.

A máte v zahraničí i pobočky nebo se zákazníky pracujete na dálku?

Občas se s nimi potkáme, ale převážně je to na dálku, žádné pobočky nemáme. Apify je takzvaně self-service online služba. Lidé přijdou a dokáží najít hotové řešení pro svůj projekt v našem Apify Store. Jen pokud potřebují pomoct nebo nějaký speciální plán nebo řešení, tak si s nimi náš tým zavolá.

Máte nějakou speciální firemní kulturu? Nebo čím to je, že se firmě poměrně daří, čím si to vysvětlujete?

Už od samého začátku jsme firmu stavěli jako globální softwarový produkt, nikdy jsme nebyli zaměření jen na Česko. Tím, že jsme čistě internetová služba, tak geografie nehraje roli, nemá to vlastně žádná specifika pro konkrétní země. Neprodáváme fyzické zboží a nemusíme tedy řešit jeho distribuci. Snažíme se neustále inovovat, zkoušet nové věci, hledat talentované lidi, nebýt zahlceni byrokracií a zbytečnými procesy, a tak se posouvat rychle dopředu. Podařilo se nám vybudovat tým skvělých a pracovitých lidí, kteří spolu drží i mimo práci. A samozřejmě nám pomáhá to, že globální poptávka po datech neustále roste a zřejmě poroste i nadále.

Koukala jsem, že jste se přestěhovali do nově otevřené části Paláce Lucerna. Řešíte ve firmě nějak to, jak vypadají vaše prostory?

Je to tak, sídlíme v bývalém ateliéru Vácslava Havla, zakladatele Lucerny a dědečka prezidenta Václava Havla. Jsme pod střechou, kde maloval své obrazy. Lucerna je krásná budova. Podařilo se nám zde pronajmout výjimečné prostory a upravit si je podle našich představ. Díváme se na to tak, že když lidé nemusí do kanceláře dojíždět moc dlouho a cítí se v ní dobře, tak raději než pracovat na dálku, přijdou do práce osobně, kde se potkávají s kolegy a zlepšuje to spolupráci. Často u nás pořádáme i různé přednášky a meetupy, tak Vás i čtenáře na některém z nich rádi uvidíme.

Přečtěte si na našem blogu i další příběhy českých firem, které byly v letošním ročníku programu Deloitte Technology Fast 50 úspěšné.

Deloitte Technology Fast 50

Nadcházející akce

Semináře, webcasty, pracovní snídaně a další akce pořádané společností Deloitte.

    Zobrazit vícearrow-right