Notebookcheck Logo

Program pilotażowy European Open Web Index zapewnia dostęp do prawie 1 petabajta zaindeksowanych danych

Europejski indeks Open Web Index wchodzi w fazę pilotażową w czerwcu (źródło zdjęcia: Dall-E 3)
Europejski indeks Open Web Index wchodzi w fazę pilotażową w czerwcu (źródło zdjęcia: Dall-E 3)
W przyszłym miesiącu konsorcjum OpenWebSearch.eu uruchomi pilotażowy program Open Web Index, który zapewni badaczom i programistom dostęp do prawie jednego petabajta europejskich danych internetowych.
Business AI

Konsorcjum OpenWebSearch.eu otworzy w przyszłym miesiącu pierwszy sfederowany, ogólnoeuropejski Open Web Index (OWI) dla zewnętrznych testerów. Pilotaż zapewnia dostęp do prawie jednego petabajta zaindeksowanych danych internetowych i stanowi pierwszy krok w kierunku długoterminowego indeksu, który ma osiągnąć 5 PB, a docelowo 10 PB treści.

W przeciwieństwie do konwencjonalnej wyszukiwarki, OWI funkcjonuje jako współdzielona biblioteka cyfrowa, którą mogą przeszukiwać zewnętrzne usługi - portale, dostawcy dużych modeli językowych lub zespoły badawcze - w celu pobrania dokumentów. 14-osobowe partnerstwo uniwersytetów, centrów superkomputerowych, firm technologicznych i CERN finansuje infrastrukturę, starając się zmniejszyć zależność Europy od zastrzeżonych indeksów utrzymywanych przez Google, Microsoft i innych operatorów z siedzibą w USA.

Zwolennicy twierdzą, że centralizacja wokół platform opartych na reklamach osłabiła jakość wyszukiwania i ograniczyła zasięg językowy. Prowadząc niekomercyjny, oparty na standardach indeks w europejskiej przestrzeni regulacyjnej, konsorcjum ma nadzieję zachęcić do korzystania z usług, które przestrzegają lokalnych zasad ochrony danych, wyświetlają wyniki w wielu językach i unikają agresywnych reklam lub samodzielnych odniesień. Organy regulacyjne w Brukseli i Londynie wielokrotnie kwestionowały dominację amerykańskich firm technologicznych właśnie na tych podstawach.

Podczas pilotażu grupy akademickie, start-upy i indywidualni programiści mogą uzyskać zbiór danych na podstawie ogólnej licencji badawczej lub ubiegać się o licencję komercyjną. Menedżer ds. społeczności Ursula Gmelch opisuje uruchomienie jako "pierwszy krok w kierunku prawdziwej europejskiej suwerenności cyfrowej", dodając, że wczesne informacje zwrotne określą, w jaki sposób indeks ewoluuje, aby dopasować się do rzeczywistego zapotrzebowania. Zespół jest szczególnie zainteresowany wyszukiwaniem wertykalnym i argumentacyjnym, generowaniem wspomaganym wyszukiwaniem i powiązanymi aplikacjami AI.

Harmonogram jest zgodny z InvestAI, programem Komisji Europejskiej, który ma na celu zmobilizowanie 200 miliardów euro (około 224,7 miliarda dolarów) na projekty związane ze sztuczną inteligencją. Otwarta sesja Zoom zaplanowana na godzinę 10:00 - popołudnie CEST w dniu 6 czerwca wprowadzi uczestników na platformę i roześle dane uwierzytelniające. Jeśli próba zakończy się sukcesem, może dać małym i średnim europejskim firmom surowiec potrzebny do zbudowania konkurencyjnych narzędzi wyszukiwania i sztucznej inteligencji niezależnie od dominujących ekosystemów w USA.

Źródło(a)

OpenWebSearch (w języku angielskim)

Please share our article, every link counts!
Mail Logo
> laptopy testy i recenzje notebooki > Nowinki > Archiwum v2 > Archiwum 2025 05 > Program pilotażowy European Open Web Index zapewnia dostęp do prawie 1 petabajta zaindeksowanych danych
Nathan Ali, 2025-05-20 (Update: 2025-05-20)