VisionaryAI Suite – Inställningar

Konfigurera hur VisionaryAI analyserar text, bilder, video och ljud.

LLM-inställningar

LLM-inställningarna styr vilken språkmodell som används för att analysera text, transkriptioner och sammanfattningar i VisionaryAI.

Användaren kan välja leverantör, ange modell-ID och konfigurera API-anslutning till lokala eller externa AI-motorer.

Systemet fungerar exempelvis sömlöst med LM Studio och andra OpenAI-kompatibla API:er.

Bildanalys

VisionaryAI använder moderna computer-vision-modeller som YOLO, BLIP och CLIP för att identifiera objekt, skapa bildbeskrivningar och generera relevanta taggar.

  • val av objektklasser
  • konfidensnivåer
  • antal objekt per bild
  • val av AI-modeller

Semantiskt minne

CLIP-baserad analys gör det möjligt att förstå bilder baserat på semantisk likhet. VisionaryAI kan därför hitta visuellt liknande bilder även när de inte innehåller exakt samma objekt.

Systemet kan även använda referensbibliotek av bilder för att skapa mer kontextuella taggar och förbättra analysen över tid.

Prompt-inställningar

Promptinställningarna styr hur AI-modeller instrueras att analysera olika typer av media.

VisionaryAI använder specialdesignade prompt-mallar för videoanalys, bildanalys och ljudtranskription.

Ljudanalys

VisionaryAI använder Whisper-modeller för att konvertera tal till text med hög precision.

  • röstaktivitetsdetektion
  • talaridentifiering (diarisation)
  • ordnivå-synkronisering

Videoanalys

VisionaryAI kan extrahera nyckelbilder från video och analysera dem med computer-vision-modeller.

Samtidigt transkriberas ljudspåret för att skapa en komplett multimodal analys.

Textanalys

Analysera dokument, e-post och rapporter för att identifiera mönster, teman och återkommande problem.

Export till PDF / HTML

Skapa strukturerade rapporter från analyser och exportera dem till PDF eller HTML.

Hårdkodade undertexter

Generera undertexter från tal och bädda in dem direkt i videofiler.

VTAG Metadata Editor

Redigera och organisera metadata kopplad till mediafiler.