Damit man direkt in Oracle AI Datenbanken Vector Indizes erzeugen und nutzen kann, benötigt man Modelle im ONNX Format. Anfangs gab es mit dem all_MiniLM nur ein ONNX Modell, inzwischen hat Oracle einige weitere ONNX Format Modelle zum Download bereitgestellt.
Diese findet man – etwas versteckt – im Oracle AI Vector Search User´s Guide im Kapitel Import Pretrained Models in ONNX Format.
Alternativ kann man selbst Pretrained Modelle in ONNX Modelle konvertieren. Dafür gibt es seitens Oracle eine Anleitung für OML4Py. Wie leider sehr oft üblich, benötigt man ganz spezifische Versionen vom OLM4Py sowie Python – aus diesem Grund ist es empfehlenswert, dafür eine eigene VM (oder einen Container) zu nutzen.
Egal ob man die von Oracle bereitgestellten ONNX Module oder selbst erzeugte Module nutzen möchte, muss man diese im Anschluss noch in die Oracle AI Datenbank laden. Die passende Anleitung findet man ebenfalls in der Oracle AI Vector Search Dokumentation. Sobald das Modell geladen ist, kann man direkt in der Datenbank VECTOR Indizes und Vector Embedings erzeugen, ohne von externen AI abhängig zu sein.
