Docspell
Organizator de documente auto-găzduit cu OCR, extracție NLP și căutare full-text
Alege planul VPS pentru implementarea Docspell
Se reînnoiește la prețul de 14,99 €/lună pentru o perioadă de 2 ani. Poți anula oricând.
Despre Docspell
Docspell este un server de gestionare a documentelor auto-găzduit, open-source, conceput special pentru organizarea teancurilor de hârtii care au fost deja scanate, descărcate sau primite prin email. Acolo unde serviciile comerciale SaaS de documente schimbă comoditatea cu vizibilitatea în cele mai sensibile aspecte ale vieții personale și ale afacerilor mici — declarații fiscale, dosare medicale, corespondență juridică, contracte, chitanțe — Docspell păstrează întreaga arhivă pe infrastructura pe care o controlezi, oferind în continuare OCR, extragere NLP, căutare full-text și etichetare bogată, gata de utilizare. Rezultatul este un dulap de clasificare privat, interogabil, care se adaptează de la documentele casnice ale unui singur utilizator la spații de lucru multi-chiriaș partajate între echipe mici.
Cazuri de utilizare comune
Gospodăriile utilizează Docspell ca un centru centralizat pentru formulare fiscale, facturi de utilități, documente de asigurare, corespondență școlară și documente de garanție — permițând oricărui membru al familiei să încarce prin interfața web, atașamente de email la o adresă configurată sau să plaseze scanări într-un folder sincronizat. Freelancerii și consultanții utilizează Docspell ca arhivă canonică pentru facturi, contracte și chitanțe de cheltuieli, profitând de sumele și datele extrase prin NLP pentru a urmări profitabilitatea proiectelor fără introducere manuală de date. Afacerile mici își auto-găzduiesc Docspell pentru păstrarea înregistrărilor AP/AR, stocarea facturilor compatibilă cu auditul și accesul partajat în cadrul unei echipe de contabilitate, păstrând în același timp datele furnizorilor în limitele de încredere ale companiei. Genealogii și arhiviștii de familie scanează colecții de scrisori, certificate și fotografii vechi de zeci de ani în Docspell, astfel încât OCR-ul face înregistrările scrise de mână descoperibile, iar extragerea metadatelor scoate la iveală date și entități numite. Utilizatorii conștienți de confidențialitate își auto-găzduiesc Docspell pentru a gestiona dosare medicale, corespondență de sănătate mintală, date de fertilitate și documente legale pe care nu doresc în mod specific să le vadă circulând printr-un grafic de documente SaaS. Clinicile mici, cabinetele de avocatură și firmele de consultanță implementează Docspell ca o instanță multi-colectivă — spații de lucru separate per client sau caz — fără taxele per utilizator impuse de platformele comerciale de documente.
Funcționalități cheie
- Pipeline OCR folosind Tesseract care procesează PDF-uri scanate, imagini și faxuri în text căutabil la ingestie
- Extragere NLP a datelor, corespondenților, sumelor și contactelor care pre-clasifică documentele în inbox
- Căutare full-text bazată pe Solr cu filtre după etichetă, folder, câmp personalizat, interval de date și corespondent
- Integrare Mail-fetch care interoghează căsuțele poștale IMAP pentru atașamente de importat automat
- Endpoint HTTP de integrare pentru aplicații însoțitoare de scaner și pipeline-uri personalizate de încărcare
- Conversie de documente prin WeasyPrint, Unoconv și Tesseract, transformând fișiere HTML, Office, email și imagine în PDF-uri căutabile
- Arhitectură multi-colectivă care oferă fiecărui spațiu de lucru utilizatori, documente, etichete și metadate izolate
- Sistem de etichetare cu etichete categorice, câmpuri personalizate, organizații și persoane pentru o adnotare
- Interogări salvate care se actualizează automat pe măsură ce noi documente corespondente sosesc în arhivă
- Ierarhia folderelor plus reorganizare prin drag-and-drop direct în interfața web
- Suport pentru criptare în repaus pentru colecțiile de documente sensibile prin configurarea backend-ului PostgreSQL
- Controale pentru modul de înregistrare (deschis, invitație, închis), astfel încât noile instanțe să poată fi blocate după ce administratorul inițial se înregistrează
- API REST și CLI (instrumentul dsc) pentru automatizare, importuri în masă și integrare cu sisteme externe
De ce să implementezi Docspell pe Hostinger VPS
Rularea Docspell pe un Hostinger VPS oferă gospodăriilor, freelancerilor și întreprinderilor mici o arhivă privată de documente care nu trece prin niciun furnizor SaaS. Metadatele documentelor dezvăluie mai mult decât își dau seama majoritatea utilizatorilor — relații financiare, istoric medical, componența familiei, angajamente profesionale — iar auto-găzduirea pe o infrastructură pe care o controlezi menține acele date în interiorul limitei tale de încredere în mod implicit. CPU-ul dedicat pe un VPS gestionează simultan serverul REST bazat pe JVM, worker-ul joex care rulează OCR și conversia documentelor, și indexul Solr fără limitare, chiar și în timpul importurilor în masă. Stocarea persistentă a volumelor menține baza de date PostgreSQL, indexul full-text Solr și documentele încărcate durabile pe parcursul repornirilor containerelor și al actualizărilor gazdei — important pentru un sistem a cărui valoare crește pe măsură ce se acumulează ani de înregistrări. Combinat cu rutarea HTTPS bazată pe Traefik pe un nume de gazdă curat, de marcă, interfața de utilizare pentru încărcare și traficul IMAP-fetch rămân criptate TLS, iar punctul final de integrare la care scannerele și instrumentele CLI postează este, de asemenea, accesibil prin HTTPS. Amprenta celor patru servicii (server REST, joex, Postgres, Solr) este mai mare decât cea a unui instrument cu un singur binar, așa că un plan VPS de nivel mediu este o potrivire mai bună decât cele mai mici planuri, dar compromisul oferă o arhivă semnificativ mai capabilă decât pot oferi instrumentele de documente mai ușoare.
Alege planul VPS pentru implementarea Docspell
Se reînnoiește la prețul de 14,99 €/lună pentru o perioadă de 2 ani. Poți anula oricând.