Biblier
Vyhľadávanie špecializované na PDF dokumenty s vlastným grafickým rozhraním alebo jednoduchou integráciou do Vašej aplikácie pomocou RESTful rozhrania. Obsahuje vlastný jazykový analyzátor, český a slovenský stemmer, štatistiky pomáhajúce analyzovať dokumenty a ďalšie lingvistické analyzátory. Možnosť extrakcie metadát alebo dokumentov z rôznych databáz. Pri paralelnom behu dokáže systém biblier analýzovať rádovo desiatky milónov (10.000.000) dokumentov každý deň.
Hlavné vlastnosti
- multiplatformnosť,
- paralelizmus,
- triviálna integrácia do vlastnej aplikácie (web aplikácia, informačný systém, desktopová aplikácia),
- plugin pre OCR,
- možnosť inteligentne orezávať/kategorizovať výsledky,
- detailné štatistiky o dokumentoch - data mining a vizualizácia dostupných informácií pomáha k zlepšeniu kvality vyhľadávania,
- vlastný český a slovenský stemmer,
- extrakcia dokumentov a dát zo štandardných databáz (napr. MySQL, PgSQL, MSSQL, Oracle),
- vlastné extraktor textu z pdf (optimalizované pre akcentované jazyky).
Technická špecifikácia: prosím, kontaktujte nás.

