Konsorcjum OpenWebSearch.eu otworzy w przyszłym miesiącu pierwszy sfederowany, ogólnoeuropejski Open Web Index (OWI) dla zewnętrznych testerów. Pilotaż zapewnia dostęp do prawie jednego petabajta zaindeksowanych danych internetowych i stanowi pierwszy krok w kierunku długoterminowego indeksu, który ma osiągnąć 5 PB, a docelowo 10 PB treści.
W przeciwieństwie do konwencjonalnej wyszukiwarki, OWI funkcjonuje jako współdzielona biblioteka cyfrowa, którą mogą przeszukiwać zewnętrzne usługi - portale, dostawcy dużych modeli językowych lub zespoły badawcze - w celu pobrania dokumentów. 14-osobowe partnerstwo uniwersytetów, centrów superkomputerowych, firm technologicznych i CERN finansuje infrastrukturę, starając się zmniejszyć zależność Europy od zastrzeżonych indeksów utrzymywanych przez Google, Microsoft i innych operatorów z siedzibą w USA.
Zwolennicy twierdzą, że centralizacja wokół platform opartych na reklamach osłabiła jakość wyszukiwania i ograniczyła zasięg językowy. Prowadząc niekomercyjny, oparty na standardach indeks w europejskiej przestrzeni regulacyjnej, konsorcjum ma nadzieję zachęcić do korzystania z usług, które przestrzegają lokalnych zasad ochrony danych, wyświetlają wyniki w wielu językach i unikają agresywnych reklam lub samodzielnych odniesień. Organy regulacyjne w Brukseli i Londynie wielokrotnie kwestionowały dominację amerykańskich firm technologicznych właśnie na tych podstawach.
Podczas pilotażu grupy akademickie, start-upy i indywidualni programiści mogą uzyskać zbiór danych na podstawie ogólnej licencji badawczej lub ubiegać się o licencję komercyjną. Menedżer ds. społeczności Ursula Gmelch opisuje uruchomienie jako "pierwszy krok w kierunku prawdziwej europejskiej suwerenności cyfrowej", dodając, że wczesne informacje zwrotne określą, w jaki sposób indeks ewoluuje, aby dopasować się do rzeczywistego zapotrzebowania. Zespół jest szczególnie zainteresowany wyszukiwaniem wertykalnym i argumentacyjnym, generowaniem wspomaganym wyszukiwaniem i powiązanymi aplikacjami AI.
Harmonogram jest zgodny z InvestAI, programem Komisji Europejskiej, który ma na celu zmobilizowanie 200 miliardów euro (około 224,7 miliarda dolarów) na projekty związane ze sztuczną inteligencją. Otwarta sesja Zoom zaplanowana na godzinę 10:00 - popołudnie CEST w dniu 6 czerwca wprowadzi uczestników na platformę i roześle dane uwierzytelniające. Jeśli próba zakończy się sukcesem, może dać małym i średnim europejskim firmom surowiec potrzebny do zbudowania konkurencyjnych narzędzi wyszukiwania i sztucznej inteligencji niezależnie od dominujących ekosystemów w USA.
Źródło(a)
OpenWebSearch (w języku angielskim)