tessl/maven-io-quarkiverse-langchain4j--quarkus-langchain4j-gemini-common

Common shared infrastructure for integrating Google Gemini AI models with Quarkus applications through the LangChain4j framework, providing base chat model functionality, schema mapping, and embedding model support.

Overview

Eval results

Files

Embedding Model Implementation

Name: tessl/maven-io-quarkiverse-langchain4j--quarkus-langchain4j-gemini-common
Author: tessl

Abstract base class for implementing Gemini embedding models with support for single and batch embeddings, configurable output dimensions, and task-specific embeddings.

Capabilities

Gemini Embedding Model

Provides embedding generation capabilities for text using Google's Gemini embedding models. Implements LangChain4j's EmbeddingModel interface with support for single and batch operations.

public abstract class GeminiEmbeddingModel implements EmbeddingModel {
    /**
     * Creates a Gemini embedding model with the specified configuration.
     *
     * @param modelId The Gemini embedding model identifier (e.g., "text-embedding-004")
     * @param dimension The output embedding dimension (e.g., 768). Null uses model default
     * @param taskType The task type for task-specific embeddings (e.g., "RETRIEVAL_DOCUMENT")
     */
    public GeminiEmbeddingModel(String modelId, Integer dimension, String taskType);

    /**
     * Generates an embedding for a single text string.
     *
     * @param text The text to embed
     * @return Response containing the embedding vector
     */
    @Override
    public Response<Embedding> embed(String text);

    /**
     * Generates embeddings for multiple text segments in a batch.
     *
     * @param textSegments List of text segments to embed
     * @return Response containing list of embedding vectors
     */
    @Override
    public Response<List<Embedding>> embedAll(List<TextSegment> textSegments);

    /**
     * Subclass-specific implementation for single embedding generation.
     * Must be implemented by concrete subclasses to call the Gemini API.
     *
     * @param request The embedding request with text and configuration
     * @return The embedding response from the API
     */
    protected abstract EmbedContentResponse embedContent(EmbedContentRequest request);

    /**
     * Subclass-specific implementation for batch embedding generation.
     * Must be implemented by concrete subclasses to call the batch Gemini API.
     *
     * @param requests The batch embedding requests
     * @return The batch embedding response from the API
     */
    protected abstract EmbedContentResponses batchEmbedContents(EmbedContentRequests requests);
}

Task Types

Gemini supports task-specific embeddings optimized for different use cases:

TASK_TYPE_UNSPECIFIED: Default task type
RETRIEVAL_QUERY: Optimized for search queries
RETRIEVAL_DOCUMENT: Optimized for documents to be retrieved
SEMANTIC_SIMILARITY: Optimized for similarity comparison tasks
CLASSIFICATION: Optimized for classification tasks
CLUSTERING: Optimized for clustering tasks
QUESTION_ANSWERING: Optimized for Q&A tasks
FACT_VERIFICATION: Optimized for fact checking tasks

Usage Examples

Basic Single Embedding

public class MyGeminiEmbeddingModel extends GeminiEmbeddingModel {

    private final GeminiRestApi restApi;

    public MyGeminiEmbeddingModel(String apiKey) {
        super(
            "text-embedding-004",  // modelId
            768,                   // dimension
            "RETRIEVAL_DOCUMENT"   // taskType
        );
        this.restApi = createRestApi(apiKey);
    }

    @Override
    protected EmbedContentResponse embedContent(EmbedContentRequest request) {
        return restApi.embedContent(request);
    }

    @Override
    protected EmbedContentResponses batchEmbedContents(EmbedContentRequests requests) {
        return restApi.batchEmbedContents(requests);
    }
}

// Use the model
MyGeminiEmbeddingModel model = new MyGeminiEmbeddingModel(apiKey);
Response<Embedding> response = model.embed("Hello, world!");

float[] vector = response.content().vector();
System.out.println("Embedding dimension: " + vector.length);

Batch Embeddings

MyGeminiEmbeddingModel model = new MyGeminiEmbeddingModel(apiKey);

List<TextSegment> segments = List.of(
    TextSegment.from("First document about machine learning"),
    TextSegment.from("Second document about natural language processing"),
    TextSegment.from("Third document about computer vision")
);

Response<List<Embedding>> response = model.embedAll(segments);

for (int i = 0; i < response.content().size(); i++) {
    Embedding embedding = response.content().get(i);
    System.out.println("Document " + i + " embedding: " + embedding.vector().length + " dimensions");
}

Task-Specific Embeddings

// For search queries
public class QueryEmbeddingModel extends GeminiEmbeddingModel {
    public QueryEmbeddingModel(String apiKey) {
        super(
            "text-embedding-004",
            768,
            "RETRIEVAL_QUERY"      // Optimized for queries
        );
        // ...
    }
}

// For documents
public class DocumentEmbeddingModel extends GeminiEmbeddingModel {
    public DocumentEmbeddingModel(String apiKey) {
        super(
            "text-embedding-004",
            768,
            "RETRIEVAL_DOCUMENT"   // Optimized for documents
        );
        // ...
    }
}

// Use different models for queries vs documents
QueryEmbeddingModel queryModel = new QueryEmbeddingModel(apiKey);
DocumentEmbeddingModel docModel = new DocumentEmbeddingModel(apiKey);

Response<Embedding> queryEmbedding = queryModel.embed("machine learning algorithms");
Response<Embedding> docEmbedding = docModel.embed("A comprehensive guide to ML algorithms...");

// Compare embeddings for semantic search
double similarity = cosineSimilarity(
    queryEmbedding.content().vector(),
    docEmbedding.content().vector()
);

Custom Output Dimensions

// Use custom dimension (e.g., 256 instead of default 768)
public class CompactEmbeddingModel extends GeminiEmbeddingModel {
    public CompactEmbeddingModel(String apiKey) {
        super(
            "text-embedding-004",
            256,                   // Smaller dimension for efficiency
            "SEMANTIC_SIMILARITY"
        );
        // ...
    }
}

CompactEmbeddingModel model = new CompactEmbeddingModel(apiKey);
Response<Embedding> response = model.embed("Compact embedding");
// Output will be 256-dimensional instead of 768

Configuration Notes

Model ID: Common Gemini embedding models include:
- text-embedding-004: Latest general-purpose embedding model
- text-multilingual-embedding-002: Multilingual support
Dimension: Output embedding size. Null uses the model's default dimension. Lower dimensions trade accuracy for efficiency and storage.
Task Type: Choosing the right task type improves embedding quality for specific use cases. Use RETRIEVAL_QUERY for queries and RETRIEVAL_DOCUMENT for documents in search applications.

Integration with LangChain4j

The GeminiEmbeddingModel implements LangChain4j's EmbeddingModel interface, making it compatible with:

EmbeddingStore: Store embeddings in vector databases
RetrievalAugmentor: Use embeddings for RAG (Retrieval-Augmented Generation)
EmbeddingStoreIngestor: Batch ingestion of documents into embedding stores
SemanticSearch: Semantic similarity-based search

API Request/Response Types

The abstract methods work with these request and response types:

EmbedContentRequest: Single embedding request with model, content, task type, and dimensions
EmbedContentResponse: Single embedding response with vector
EmbedContentRequests: Batch embedding requests
EmbedContentResponses: Batch embedding responses

See Requests and Responses for detailed documentation of these types.

Install with Tessl CLI

npx tessl i tessl/maven-io-quarkiverse-langchain4j--quarkus-langchain4j-gemini-common

docs

requests-responses.md

utilities.md

tile.json