Ga naar de hoofdinhoud Ga naar de zoekopdracht Ga naar de hoofdnavigatie

Bouw een extra brein voor je bedrijf

Datum November 5, 2025 11:00

Wij zijn een bedrijf dat bouwt op knowhow. Computers zijn ingewikkelde beestjes onderhevig aan snel veranderende omstandigheden en wetmaatigheden. Welke hardware past bij elkaar? Hoe past de hardware bij de software. Welke software heeft welke hardware minimaal nodig en waneer heb je een ideaale configuratie.
Voor een bedrijf als het onze wil je dus een archief om op dat knowhow terug te kunnen vallen ook voor configuraties van tien jaar geleden. Wil zeggen in nerd taal een Knowledgebase.
Die bestaan al jaren maar hebben nu een enorme boost gekregen door AI.
Dat is totdat je probeert om er een voor jouw bedrijf te vinden en te implementeren. En daar zijn we nu al een tijd mee bezig.
Er zijn er tig in de vije verkoop, als SaaS oplossing. Nadeel hiervan is dat jou data daan Joost-mag-het-weten-waar rondslingert. Nou zijn er veel mensen die dat niet interesseert, wij horen daar niet bij.
Dus de RAG die wij gebruiken draait lokaal en zeker niet op een van de Americaanse cloud aanbieders.

Wij hebben een hoop software pakketten getest en geen een heeft het tot de eindstreep gehaald. Wat wel een goede oplossing was: n8n met tal van scripts en plugins in combinatie met Supabase DB. Dit werkte goed maar was complex in de opbouw. Hier is het ding met complex in IT: het faalt, vroeger of later, meestal vroeger.

Uiteindelijk werdt het: Obsidian met Ai plugin, PDF extractor plugin en gekoppelt aan LM Studio (lokale AI).
Obsidian is een Notes applicatie die met plugins aangepasst kan worden met functionaliteit na behoefte, indien verstande dat een overmaat aan plugins conflicten kan creeren. Er zijn een aantal AI plugins die in Obsidian gebruikt kunnen worden en idem bestaan er MCP Servers waarmee je bijvoorbeeld Claude Desktop kan verbinden en toegang geven tot je data.
De PDF Extractor doet exact dat: van een pdf textformaat maken. Veel AI's beweren pdf te kunnen lezen alleen blijkt dit best foutgevoelig te zijn. IT is niet een vak waar foutjes welkom zijn, dus een makkelijker leesbaar formaat, gewone text, heeft duidelijk de voorkeur.
Mocht je juist enorm lange pdf's (500 pagina en dergelijken) dan zou een abonement bij Mistral AI een uitkomst kunnen zijn. Mistral heeft een uitstekende OCR AI die zeer prijsgunstig is

En dan heb je zeker een beest van een computer nodig?

Dat valt gelukkig wel mee. Wij testen meerdere configuraties:
Best werkend: AMD 9950X, 128Gb RAM, PCI5 SSD 1TB en RTX 5080 voor de GPU computing (de RTX 5090 zo hier ideaal zijn maar is best prijzig) en als OS: CachyOS Linux. Linux is geen vereiste maar is sneller, beter en stabieler.
De minmale configuratie bleek: i7 265K, 32GB RAM, PCI4 SSD en RTX 5060 16GB voor de GPU compute.

Waar heeft de hardware invloed op: te kleine VGA kaart en te weinig RAM beteken alleen kleine LLM's. Hiervan zijn de prestaties dan wel iets minder. Je hebt zowel een LLM als een embedding model nodig, deze zijn over het algemeen vrij klein en zorgen voor vector representaties van data of beelden waardoor het model semantische relaties en overeenkomsten tussen verschillende objecten kan vastleggen.

Voor de AI modellen: wij gebruiken OpenRouter. Dit platform is een pay-as-you-go AI platform dat in reaal gebruik gunstiger is dan abonementen bij  OpenAI, Anthropic enzoverder. Via hun API key kun je tig AI modellen gebruiken, ook die van OpenAI, Claude en anderen.

Dus, uiteindelijk draait alles lokaal en gaat er geen data na plekken waar die niet hoort. Best coole setup.