Kur yra atviro kodo paskirstymo paieška? - 💡 Fix My Ideas

Kur yra atviro kodo paskirstymo paieška?

Kur yra atviro kodo paskirstymo paieška?


Autorius: Ethan Holmes, 2019

Prieš „Google“, daugelis įsilaužėlių savo paieškos metu rašė paieškos sistemas. Bendras sutarimas, bent jau iš mano prisiminimų, buvo tai, kad paieška buvo problema, kurią reikėjo išspręsti, ir kad visi dabartiniai sprendimai buvo daugiau ar mažiau žįsti. Šiandien paieška apima didžiulę teritoriją ir vis dar yra daug problemų, kurias reikia išspręsti, tačiau dažniausiai žiniatinklio paieška yra labai naudinga ir patikima. Tai nėra tobula, yra patobulinimų, bet jis atlieka darbą. Aš nežinau, kad per daug žmonių šiais laikais praleidžia savo įsilaužimo paiešką. Kodėl iš naujo sukurti tokią žemo lygio paslaugą, kai yra tiek daug novatoriškų ir aukštesnio lygio interneto programų?

Svarbu tai, kad paieška yra žiniatinklio operacinė sistema. Tai, kad mes neturime atviro kodo / atviro duomenų paieškos infrastruktūros, yra tokia pat bloga, lyg nebūtų Linux ar OpenBSD. Jei „Google“, „Yahoo“ ir „MS“ nesuteikė tokio didelio produkto, mano spėjimas yra tai, kad įsilaužėlių bendruomenė atakuos šią problemą, pavyzdžiui, Kapitono Kirko dėl driežas.

Kur mes esame:

Šiuo metu yra keletas atviro kodo projektų, susijusių su bendruoju žiniatinkliu. Visų pirma „Java“ pagrįstas „Lucene“ projektas yra tvirtas pagrindas indeksavimui ir informacijos paieškai, o tai yra „Nutch“ paieškos sistema.

Yra keletas platintojų, pavyzdžiui, „Grub“ ir „Majestic“ 12. Deja, abu šie duomenys perduodami į centrinę, privačią saugojimo sistemą. Sunkus nuskaitymo ir indeksavimo darbas yra atviras visiems, kurie gali dalyvauti, tačiau gaunami duomenys nėra.

Kur mes turime būti:

Mano nuomone, ieškoti įsilaužėliai turi sukurti atviro kodo sprendimą:

  • Paskirstytasis mechanizmas, skirtas žiniatinklio masiniam matavimui ir indeksavimui.
  • Platinamas, decentralizuotas, nereikalingas duomenų saugojimas talpyklai ir indeksui.
  • Galutinio vartotojo, viešai veikiančio sąsajos, skirtos paskirstyto indekso užklausai.
  • Vietinio, privataus indekso ir talpyklos gabalo paieškos arba nuskaitymo mechanizmas, skirtas tyrimams ar asmeniniam naudojimui.
  • Būdas skelbti alternatyvius indeksavimo modelius paskirstytam tinklui.

Visos šios priemonės turi būti suprojektuotos su prielaida, kad kiekvienas gali ir turės prieigą prie sistemos duomenų, ir kai sistema augs, bus žmonių, korporacijų ir vyriausybių, kad jie sugadintų paieškos infrastruktūrą.

Tai nėra lengva problema, tačiau turite pripažinti, kad tai įdomi problema. Kiekvienas, norintis būti paieškos Torvaldu?

Kur pradėti:

„Lucene Project“ - „Link Nutch“ atvirojo kodo paieškos sistema - nuoroda atviro kodo paieška „Wiki“ nuoroda

Ar aš nieko praleidau? Prašome pasidalinti savo mintimis apie atviro kodo paiešką komentaruose.



Jums Gali Būti Įdomu

Apžvalga: LulzBot FlexyStruder lanksčios gijų ekstruderio

Apžvalga: LulzBot FlexyStruder lanksčios gijų ekstruderio


„CityZen“ duomenys: „Horacio Gonzalez“ konferencija „Maker Faire Paris“.

„CityZen“ duomenys: „Horacio Gonzalez“ konferencija „Maker Faire Paris“.


„Intel Galileo“ pristato „Pigeon Sim“ Maker Faire Paris

„Intel Galileo“ pristato „Pigeon Sim“ Maker Faire Paris


Siurblio takelio kūrimas

Siurblio takelio kūrimas






Naujausios Žinutės