Slováci každých osm dní vytváří z 65 TB dat umělou inteligenci o velikosti 17 MB. A rozjeli spolupráci s Intelem

21. 5. 2024

Doba čtení: 5 minut

V ESETu neustále vytváří nové 17MB modely umělé inteligence z výchozích 65 TB dat. To je o asi 20 TB víc, než kolik se použilo na GPT-3.

Práce s velkými jazykovými modely (LLM) typu GPT není pouze záležitostí společnost jako OpenAI, Anthropic, Meta, Mistral nebo Google. Jiné technologické firmy podobné aktivity mají také. Seznam třeba chystá vlastní AI, k čemuž si pořídil stovky karet od Nvidie. Další podniky si data zpracovávají pro své specifické účely. Slovenská kyberbezpečnostní společnost ESET například ze zhruba 65 TB dat na učení vytváří 17 MB velké moduly umělé inteligence sloužící k odhalování malwaru. A rozjela kolem toho spolupráci s Intelem.

Základní princip je jednoduchý. ESET vezme balík 65 TB dat, která tři až čtyři dny připravuje, aby na ně pustil strojové učení. To také běží několik dní, což je doplněno testováním. Proces celkově trvá osm dní, a jakmile je dokončen, znova a znova se opakuje s tím, že je obohacen o nová data. Výsledkem je vždy zhruba 17 MB velký model, který je distribuován koncovým uživatelům kyberbezpečnostního softwaru ESETu.

Tento model dokáže odhalovat viry a další škodliviny, a nejenom ty, které už zná. ESET pracuje s pojmem „DNA“. Mnoho malwaru je iterací či forkem předchozích škodlivých aplikací, takže přebírá části kódu či principy. Díky tomu lze automaticky detekovat malwarové rodiny. Pokud 17MB model něco takového najde a není si stoprocentně „jistý“, pošle aplikaci otestovat na větší modely běžící v datových centrech. Pokud si „jisty“ nejsou ani tyto modely, až potom podezřelý kód dostanou do rukou lidští analytici ve virus labech.

Větší objem dat než u GPT

Díky tomuto principu lze pracovat s obřími objemy dat, které se na antivirové společnosti neustále valí. ESET například zaznamenává 750 tisíc škodlivých kusů kódu denně a zpracovává 2,5 miliardy URL.

Výhod je nicméně více. Malý model běžící na koncových zařízeních výrazně limituje komunikaci mezi uživatelem a servery, což snižuje poplatky za datový traffic. Koncová zařízení také mohou díky modelům fungovat samostatně, takže kdyby třeba ESET celý spadl, počítače stále budou mít schopnost malwarové detekce.

Asi 65 TB dat, se kterými slovenská společnost pracuje, je velký objem. Model GPT-3 od OpenAI je podle dostupných informací postavený na 45 TB informací. „Používáme transformerovou architekturu. Více se specializujeme než GPT. Vybíráme si konkrétní oblast softwarové DNA, používáme vlastní metody a sledování kontextu. Nesoustředíme se na obecné zaměření, takže naše zpracování není tak výpočetně náročné,“ popsal pro Lupu výkonný ředitel ESETu Richard Marko.

Základem 65TB balíku jsou různé typy dat, primárně ovšem jde o infikované i neinfikované spustitelné soubory posbírané za mnoho let s tím, že další neustále přibývají. Nad těmito daty běží příprava spočívající v extrakci zmíněného digitálního DNA. V podstatě jde o popis toho, co daný kus kódu dělá. Následně se vytváří digitální model, který dokáže kategorizovat, zda kód je, či není nebezpečný. Výsledkem je model, respektive sada neuronových sítí schopných kategorizace.

ESET modely počítá na grafických kartách v serverech. Modely GPU a jejich množství nespecifikoval. Marko pouze uvedl, že z finančního oddělení často chodí dotazy, proč se pořád nakupují nové drahé servery. To vzhledem k cenám karet od Nvidie a obrovské poptávce na trhu dané boomem generativní AI není překvapující.

Příchod AI PC

Další potenciálně zajímavým příspěvkem do spojení umělé inteligence a kybernetické bezpečnosti jsou čipy instalované v koncových zařízeních. Princip je podobný, jak ho už několik let známe z chytrých telefonů. Tamní SoC mají kromě procesoru a grafiky také část pro AI (NPU) schopnou například dokreslovat fotky. Je otázkou času, kdy se dočkáme LLM na čipu, takže možná princip sluchátka s virtuální přítelkyní z filmu Her není daleko.

Nicméně k té bezpečnosti. Intel nedávno představil koncept takzvaných AI PC. Zatím není moc jasné, co to přesně je, asi hlavně marketing. Počítač splňující AI PC by podle všeho měl mít GPU, procesor s NPU (od Intelu) a měl by zvládat VNNI a instrukce DP4a. Intel tímto obecně propaguje čipy Core Ultra.

Polovodičový obr ke koncepci AI PC spustil partnerský program. Cílem je, aby vývojáři začali pro NPU jednotku psát aplikace (low power AI) a tím odlehčili hlavním procesorovým jádrům a zároveň mohli nabídnout podobné funkce jako telefony.

Analytická společnost Canalys odhadla, že počítače s NPU budou do roku 2027 činit 60 procent prodaných kusů. Intel se pravděpodobně připravuje na příchod potenciálně silné konkurence. AMD, Nvidia, Qualcomm a MediaTek se chystají vydat vlastní procesory pro PC ve stylu Apple Silicon, které budou mít zabudované NPU části pro zpracování AI. Microsoft oznámil funkce Copilot+ pro Windows, přičemž některé AI prvky budou dostupné pouze pro čipy s ARMem.

„Intel chápe, že svět začíná být o AI, a chce toho být součástí, takže přidává hardwarovou podporu na své čipy,“ nastínil Marko.

ESET je jedním z ideálních kandidátů, který by NPU mohl využívat, popisovaný 17MB modul už akceleraci skrze NPU zvládá. Slovenská firma už dříve s Intelem rozjela spolupráci v rámci Intel Threat Detection Technology (TDT). V tomto případě je v procesorech zabudována analýza telemetrie a vyhodnocuje se, zda na zpracování nepřichází ransomware. Modul pro strojové učení dodává ESET, který po detekci zároveň převezme roli ochránce.

„Procesory od Intelu v sobě mají diagnostické prvky, pomocích nichž se dá ladit na nich běžící software. Původně to nemělo nic společného s bezpečností, Intel si ale uvědomil, že tyto prvky poskytují dobrou představu o tom, co na procesorech běží, protože se vytváří statistiky a metadata,“ popsal Marko.

ESET také s Intelem spolupracoval na tom, jaké procesy by mohly běžet na výkonných (P-Core) a úsporných (E-Core) jádrech, které Intel do svých procesorů nově dává, opět ve stylu ARMu.

Vstoupit do diskuse (2 názory)

Jan Sedlák

Reportér Lupa.cz a E15

Témata:

Jen tak dál. :-)

Mr. McFly

'; document.getElementById('preroll-iframe').onload = function () { setupIframe(); } prerollContainer = document.getElementsByClassName('preroll-container-iframe')[0]; } function setupIframe() { prerollDocument = document.getElementById('preroll-iframe').contentWindow.document; let el = prerollDocument.createElement('style'); prerollDocument.head.appendChild(el); el.innerText = "#adContainer>div:nth-of-type(1),#adContainer>div:nth-of-type(1) > iframe { width: 99% !important;height: 99% !important;max-width: 100%;}#videoContent,body{ width:100vw;height:100vh}body{ font-family:'Helvetica Neue',Arial,sans-serif}#videoContent{ overflow:hidden;background:#000}#adMuteBtn{ width:35px;height:35px;border:0;background:0 0;display:none;position:absolute;fill:rgba(230,230,230,1);bottom:20px;right:25px}"; videoContent = prerollDocument.getElementById('contentElement'); videoContent.style.display = 'none'; videoContent.volume = 1; videoContent.muted = false; const playPromise = videoContent.play(); if (playPromise !== undefined) { playPromise.then(function () { console.log('PREROLL sound allowed'); // setUpIMA(true); videoContent.volume = 1; videoContent.muted = false; setUpIMA(); }).catch(function () { console.log('PREROLL sound forbidden'); videoContent.volume = 0; videoContent.muted = true; setUpIMA(); }); } } function setupDimensions() { prerollWidth = Math.min(iinfoPrerollPosition.offsetWidth, 480); prerollHeight = Math.min(iinfoPrerollPosition.offsetHeight, 320); } function setUpIMA() { google.ima.settings.setDisableCustomPlaybackForIOS10Plus(true); google.ima.settings.setLocale('cs'); google.ima.settings.setNumRedirects(10); // Create the ad display container. createAdDisplayContainer(); // Create ads loader. adsLoader = new google.ima.AdsLoader(adDisplayContainer); // Listen and respond to ads loaded and error events. adsLoader.addEventListener( google.ima.AdsManagerLoadedEvent.Type.ADS_MANAGER_LOADED, onAdsManagerLoaded, false); adsLoader.addEventListener( google.ima.AdErrorEvent.Type.AD_ERROR, onAdError, false); // An event listener to tell the SDK that our content video // is completed so the SDK can play any post-roll ads. const contentEndedListener = function () { adsLoader.contentComplete(); }; videoContent.onended = contentEndedListener; // Request video ads. const adsRequest = new google.ima.AdsRequest(); adsRequest.adTagUrl = iinfoVastUrls[iinfoVastUrlIndex]; console.log('Preroll advert: ' + iinfoVastUrls[iinfoVastUrlIndex]); videoContent.muted = false; videoContent.volume = 1; // Specify the linear and nonlinear slot sizes. This helps the SDK to // select the correct creative if multiple are returned. // adsRequest.linearAdSlotWidth = prerollWidth; // adsRequest.linearAdSlotHeight = prerollHeight; adsRequest.nonLinearAdSlotWidth = 0; adsRequest.nonLinearAdSlotHeight = 0; adsLoader.requestAds(adsRequest); } function createAdDisplayContainer() { // We assume the adContainer is the DOM id of the element that will house // the ads. prerollDocument.getElementById('videoContent').style.display = 'none'; adDisplayContainer = new google.ima.AdDisplayContainer( prerollDocument.getElementById('adContainer'), videoContent); } function unmutePrerollAdvert() { adVolume = !adVolume; if (adVolume) { adsManager.setVolume(0.3); prerollDocument.getElementById('adMuteBtn').innerHTML = ''; } else { adsManager.setVolume(0); prerollDocument.getElementById('adMuteBtn').innerHTML = ''; } } function onAdsManagerLoaded(adsManagerLoadedEvent) { // Get the ads manager. const adsRenderingSettings = new google.ima.AdsRenderingSettings(); adsRenderingSettings.restoreCustomPlaybackStateOnAdBreakComplete = true; adsRenderingSettings.loadVideoTimeout = 12000; // videoContent should be set to the content video element. adsManager = adsManagerLoadedEvent.getAdsManager(videoContent, adsRenderingSettings); // Add listeners to the required events. adsManager.addEventListener(google.ima.AdErrorEvent.Type.AD_ERROR, onAdError); adsManager.addEventListener( google.ima.AdEvent.Type.CONTENT_PAUSE_REQUESTED, onContentPauseRequested); adsManager.addEventListener( google.ima.AdEvent.Type.CONTENT_RESUME_REQUESTED, onContentResumeRequested); adsManager.addEventListener( google.ima.AdEvent.Type.ALL_ADS_COMPLETED, onAdEvent); // Listen to any additional events, if necessary. adsManager.addEventListener(google.ima.AdEvent.Type.LOADED, onAdEvent); adsManager.addEventListener(google.ima.AdEvent.Type.STARTED, onAdEvent); adsManager.addEventListener(google.ima.AdEvent.Type.COMPLETE, onAdEvent); playAds(); } function playAds() { // Initialize the container. Must be done through a user action on mobile // devices. videoContent.load(); adDisplayContainer.initialize(); // setupDimensions(); try { // Initialize the ads manager. Ad rules playlist will start at this time. adsManager.init(1920, 1080, google.ima.ViewMode.NORMAL); // Call play to start showing the ad. Single video and overlay ads will // start at this time; the call will be ignored for ad rules. adsManager.start(); // window.addEventListener('resize', function (event) { // if (adsManager) { // setupDimensions(); // adsManager.resize(prerollWidth, prerollHeight, google.ima.ViewMode.NORMAL); // } // }); } catch (adError) { // An error may be thrown if there was a problem with the VAST response. // videoContent.play(); } } function onAdEvent(adEvent) { const ad = adEvent.getAd(); console.log('Preroll event: ' + adEvent.type); switch (adEvent.type) { case google.ima.AdEvent.Type.LOADED: if (!ad.isLinear()) { videoContent.play(); } prerollDocument.getElementById('adContainer').style.width = '100%'; prerollDocument.getElementById('adContainer').style.maxWidth = '640px'; prerollDocument.getElementById('adContainer').style.height = '360px'; break; case google.ima.AdEvent.Type.STARTED: window.addEventListener('scroll', onActiveView); if (ad.isLinear()) { intervalTimer = setInterval( function () { // Example: const remainingTime = adsManager.getRemainingTime(); // adsManager.pause(); }, 300); // every 300ms } prerollDocument.getElementById('adMuteBtn').style.display = 'block'; break; case google.ima.AdEvent.Type.ALL_ADS_COMPLETED: if (ad.isLinear()) { clearInterval(intervalTimer); } if (prerollLastError === 303) { playYtVideo(); } break; case google.ima.AdEvent.Type.COMPLETE: if (ad.isLinear()) { clearInterval(intervalTimer); } playYtVideo(); break; } } function onAdError(adErrorEvent) { console.log(adErrorEvent.getError()); prerollLastError = adErrorEvent.getError().getErrorCode(); if (!loadNext()) { playYtVideo(); } } function loadNext() { iinfoVastUrlIndex++; if (iinfoVastUrlIndex < iinfoVastUrls.length) { iinfoPrerollPosition.remove(); playPrerollAd(); } else { return false; } adVolume = 1; return true; } function onContentPauseRequested() { videoContent.pause(); } function onContentResumeRequested() { videoContent.play(); } function onActiveView() { if (prerollContainer) { const containerOffset = prerollContainer.getBoundingClientRect(); const windowHeight = window.innerHeight; if (containerOffset.top < windowHeight/1 && containerOffset.bottom > 0.0) { if (prerollPaused) { adsManager.resume(); prerollPaused = false; } return true; } else { if (!prerollPaused) { adsManager.pause(); prerollPaused = true; } } } return false; } function playYtVideo() { iinfoPrerollPosition.remove(); youtubeIframe.style.display = 'block'; youtubeIframe.src += '&autoplay=1&mute=1'; } }

Sdílet

Větší objem dat než u GPT

Seznam.cz chystá vlastní umělou inteligenci. V češtině už je o něco lepší než GPT-3.5

Příchod AI PC

Přelomový úspěch. Slováci a Češi budou s Microsoftem či Googlem chránit kyberprostor USA

Autor článku

Jan Sedlák

Témata:

Anketa

Mají Mapy od Seznamu šanci uspět celosvětově?

Komerční sdělení

Trendy v influencer marketingu a správě sociálních sítí

Anycast: Decentralizovaný štít proti dnešním DDoS útokům

Příběh ze srdce Slovácka: Marie mění kukuřičné šustí nejen v andílky

Tahák pro maturanty a absolventy: Jak na zdravotní a sociální pojištění, kde se hlásit a na co…

Když historie mizí pod nohami. Belgické Bruggy čelí kuriózním krádežím, turisté si v batozích…

Jurečka oprášil návrh komunistky, velkým podnikatelským svazům najednou nevadí

Plyn může domácnostem za dva roky zdražit až o polovinu. Cena se zvýší i na pumpách. Někomu se to…

Trumpův odkaz. OSN předpovídá, že kvůli obchodním válkám letos globální ekonomika přijde o sedm…

Příspěvek zaměstnavatele na produkty na stáří bude povinný. Ne automatický

Když dlužník dlouhodobě nesplácí, exekuce se zastaví. Co s tím zmůže věřitel?

Temu, Shein a ti další. České organizace bojují proti levným zahraničním online tržištím, poukazují…

Slováci každých osm dní vytváří z 65 TB dat umělou inteligenci o velikosti 17 MB. A rozjeli spolupráci s Intelem

Sdílet

Větší objem dat než u GPT

Seznam.cz chystá vlastní umělou inteligenci. V češtině už je o něco lepší než GPT-3.5

Příchod AI PC

Přelomový úspěch. Slováci a Češi budou s Microsoftem či Googlem chránit kyberprostor USA

Autor článku

Anketa

Mají Mapy od Seznamu šanci uspět celosvětově?

Komerční sdělení

Podcast

Mohlo by vás zajímat

Z našich webů

Příběh ze srdce Slovácka: Marie mění kukuřičné šustí nejen v andílky

Tahák pro maturanty a absolventy: Jak na zdravotní a sociální pojištění, kde se hlásit a na co…

Když historie mizí pod nohami. Belgické Bruggy čelí kuriózním krádežím, turisté si v batozích…

Jurečka oprášil návrh komunistky, velkým podnikatelským svazům najednou nevadí

Plyn může domácnostem za dva roky zdražit až o polovinu. Cena se zvýší i na pumpách. Někomu se to…

Trumpův odkaz. OSN předpovídá, že kvůli obchodním válkám letos globální ekonomika přijde o sedm…

Příspěvek zaměstnavatele na produkty na stáří bude povinný. Ne automatický

Když dlužník dlouhodobě nesplácí, exekuce se zastaví. Co s tím zmůže věřitel?

Temu, Shein a ti další. České organizace bojují proti levným zahraničním online tržištím, poukazují…

Dále u nás najdete

Jak požádat elektronicky o voličský průkaz či korespondenční volbu?

Nová technika umožňuje snadnou tvorbu malwaru pomocí AI

Ir na pražském maratonu přežil zástavu srdce trvající 47 minut

Oneplay jsme nechtěli a nedá se zrušit. Lidé si stěžují na O2

Úroveň českých inženýrů je světová, říká šéf inovačního centra

Jurečka oprášil návrh komunistky, podnikatelským svazům nevadí

Každý druhý Čech měl někdy problém s doručením zásilky

Tahák pro maturanty a absolventy: Odkdy se platí zdravotní pojištění?

Výše povinného příspěvku na stáří je stále nejasná

Podívejte se na časosběrné video, jak se boural bývalý Telecom

Objem dat skokově roste, zvyšuje rizika deepfake útoků

Hovoří se o digitálním euru. Jaký by mělo dopad na podnikatele?

Příběh ze srdce Slovácka: Marie mění kukuřičné šustí nejen v andílky

Z rozpadajícího se hradeckého stadionu je chlouba celého kraje

Vyplňujete rádi předmět e-mailu? Seznam to teď bude dělat za vás

Parmazán není parmazán, hermelín není hermelín

Obaly oplatek KitKat a Vlnky se mění. Proč?

Pošli to AlzaBoxem. Alza začala doručovat balíky

Digitalizace v Česku nabírá na obrátkách, pomáhá i AI

Mangold se hodí při hubnutí, chutná podobně jako špenát