Indholdsfortegnelse:
Definition - Hvad betyder Apache Lucene?
Apache Lucene er et open source-projekt til et højtydende og fuldt udstyret tekstsøgemaskine-bibliotek, der er skrevet helt ved hjælp af Java.
Det er i stand til søgning i fuldtekst i dokumenter, så det er en teknologi, der er egnet til ethvert program, der kræver denne funktion, især hvis det er tværplatform.
Det blev først udviklet af Doug Cutting i 1999 og blev officielt en del af Apache Foundation's Jakarta-familie med open source Java-projekter i september 2001. Det blev opgraderet til et Apache-projekt på topniveau i februar 2005.
Techopedia forklarer Apache Lucene
Apache Lucene er en højtydende søgemaskine med konceptet "et dokument, der indeholder tekstfelter" i dets kerne logiske arkitektur. Dette giver stor fleksibilitet og gør det muligt for Lucene API at blive uafhængig af ethvert filformat.
Enhver tekst fra formater som MS Word, HTML, XML, PDF og OpenDocument kan indekseres, så længe tekstinformationen kan udvindes, hvilket betyder, at den ikke kan gøre noget med billeder.
Lucene er velegnet til ethvert program, der har brug for en fuldtekstindeksering og søgefunktion, men det er almindeligt anerkendt som et godt værktøj til implementering af internetsøgemaskiner og til lokal søgning på én side.
Funktioner inkluderer:
- Skalerbar og højtydende indeksering - det kan behandle over 150 Gb i timen på moderne hardware og kræver kun 1 Mb pr. Bunke hukommelseskrav.
- Kraftfulde, nøjagtige og effektive søgealgoritmer - det tilbyder mange typer kraftfulde forespørgsler, f.eks. Sætning, jokertegn, nærhed og rækkeviddeforespørgsler. Det har også markeret søgning og sortering efter ethvert felt.
- Cross platform - ren Java-implementering og også tilgængelig på andre programmeringssprog.
