Instructions to use lang-uk/ukr-paraphrase-multilingual-mpnet-base with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use lang-uk/ukr-paraphrase-multilingual-mpnet-base with sentence-transformers:
from sentence_transformers import SentenceTransformer model = SentenceTransformer("lang-uk/ukr-paraphrase-multilingual-mpnet-base") sentences = [ "The weather is lovely today.", "It's so sunny outside!", "He drove to the stadium." ] embeddings = model.encode(sentences) similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [3, 3] - Transformers
How to use lang-uk/ukr-paraphrase-multilingual-mpnet-base with Transformers:
# Load model directly from transformers import AutoTokenizer, AutoModel tokenizer = AutoTokenizer.from_pretrained("lang-uk/ukr-paraphrase-multilingual-mpnet-base") model = AutoModel.from_pretrained("lang-uk/ukr-paraphrase-multilingual-mpnet-base") - Inference
- Notebooks
- Google Colab
- Kaggle
Використання в якості embeddings моделі?
Дякую за дослідження і за дану модель
Натрапив в своїх дослідженнях на неї
Наразі стою на порозі вибору моделі для практики психотерапевта і дана робота виявилася топовою в моєму виборі
Цікавить зусилля, які потрібно затратити, щоб використати дану модель в якості embeddings моделі для зберігання власного dataset практики в vector store
Але бачу, що використовуються Transformers або sentence-transformers, що трохи відходить від того, що вже вмію я
Якщо підкажете, куди мені рухатися - буду вдячний
Доброго дня!
Так, ви можете використати цю модель для створення текстових ембедінгів своїх речень. Ви можете використати бібліотеку SentenceTransformer. Ось приклад:
model = SentenceTransformer('lang-uk/ukr-paraphrase-multilingual-mpnet-base')
embeddings = model.encode(sentences)
sentences - це список з вашими реченнями. Власне цей код і поверне ембедінги, які можна записати у векторну базу.
Дякую за підказку @yuriilaba
Створив GGUF варіант моделі https://huggingface.co/podarok/ukr-paraphrase-multilingual-mpnet-base
Використав туторіал https://github.com/ggml-org/llama.cpp/discussions/2948 для цього
