Spaces:

yym68686
/

uni-api

Sleeping

App Files Files Community

yym68686 commited on Oct 24, 2024

Commit

c50b8cc

1 Parent(s): d91f3fa

✨ Feature: Add support for embeddings model

Browse files

Files changed (4) hide show

main.py +14 -3
models.py +10 -1
request.py +23 -0
utils.py +1 -0

main.py CHANGED Viewed

@@ -16,7 +16,7 @@ from starlette.responses import StreamingResponse as StarletteStreamingResponse
 from fastapi.security import HTTPBearer, HTTPAuthorizationCredentials
 from fastapi.exceptions import RequestValidationError
-from models import RequestModel, ImageGenerationRequest, AudioTranscriptionRequest, ModerationRequest, UnifiedRequest
 from request import get_payload
 from response import fetch_response, fetch_response_stream
 from utils import error_handling_wrapper, post_all_models, load_config, safe_get, circular_list_encoder, get_model_dict, save_api_yaml
@@ -478,7 +478,7 @@ async def ensure_config(request: Request, call_next):
     return await call_next(request)
 # 在 process_request 函数中更新成功和失败计数
-async def process_request(request: Union[RequestModel, ImageGenerationRequest, AudioTranscriptionRequest, ModerationRequest], provider: Dict, endpoint=None, token=None):
     url = provider['base_url']
     parsed_url = urlparse(url)
     # print("parsed_url", parsed_url)
@@ -529,6 +529,10 @@ async def process_request(request: Union[RequestModel, ImageGenerationRequest, A
         engine = "moderation"
         request.stream = False
     if provider.get("engine"):
         engine = provider["engine"]
@@ -700,7 +704,7 @@ class ModelRequestHandler:
         # print("provider_list", provider_list)
         return provider_list
-    async def request_model(self, request: Union[RequestModel, ImageGenerationRequest, AudioTranscriptionRequest, ModerationRequest], token: str, endpoint=None):
         config = app.state.config
         api_list = app.state.api_list
         api_index = api_list.index(token)
@@ -904,6 +908,13 @@ async def images_generations(
 ):
     return await model_handler.request_model(request, token, endpoint="/v1/images/generations")
 @app.post("/v1/moderations", dependencies=[Depends(rate_limit_dependency)])
 async def moderations(
     request: ModerationRequest,

 from fastapi.security import HTTPBearer, HTTPAuthorizationCredentials
 from fastapi.exceptions import RequestValidationError
+from models import RequestModel, ImageGenerationRequest, AudioTranscriptionRequest, ModerationRequest, UnifiedRequest, EmbeddingRequest
 from request import get_payload
 from response import fetch_response, fetch_response_stream
 from utils import error_handling_wrapper, post_all_models, load_config, safe_get, circular_list_encoder, get_model_dict, save_api_yaml
     return await call_next(request)
 # 在 process_request 函数中更新成功和失败计数
+async def process_request(request: Union[RequestModel, ImageGenerationRequest, AudioTranscriptionRequest, ModerationRequest, EmbeddingRequest], provider: Dict, endpoint=None, token=None):
     url = provider['base_url']
     parsed_url = urlparse(url)
     # print("parsed_url", parsed_url)
         engine = "moderation"
         request.stream = False
+    if endpoint == "/v1/embeddings":
+        engine = "embedding"
+        request.stream = False
     if provider.get("engine"):
         engine = provider["engine"]
         # print("provider_list", provider_list)
         return provider_list
+    async def request_model(self, request: Union[RequestModel, ImageGenerationRequest, AudioTranscriptionRequest, ModerationRequest, EmbeddingRequest], token: str, endpoint=None):
         config = app.state.config
         api_list = app.state.api_list
         api_index = api_list.index(token)
 ):
     return await model_handler.request_model(request, token, endpoint="/v1/images/generations")
+@app.post("/v1/embeddings", dependencies=[Depends(rate_limit_dependency)])
+async def embeddings(
+    request: EmbeddingRequest,
+    token: str = Depends(verify_api_key)
+):
+    return await model_handler.request_model(request, token, endpoint="/v1/embeddings")
 @app.post("/v1/moderations", dependencies=[Depends(rate_limit_dependency)])
 async def moderations(
     request: ModerationRequest,

models.py CHANGED Viewed

@@ -111,6 +111,12 @@ class ImageGenerationRequest(BaseRequest):
     size: Optional[str] = "1024x1024"
     stream: bool = False
 class AudioTranscriptionRequest(BaseRequest):
     file: Tuple[str, IOBase, str]
     model: str
@@ -129,7 +135,7 @@ class ModerationRequest(BaseRequest):
     stream: bool = False
 class UnifiedRequest(BaseModel):
-    data: Union[RequestModel, ImageGenerationRequest, AudioTranscriptionRequest, ModerationRequest]
     @model_validator(mode='before')
     @classmethod
@@ -147,6 +153,9 @@ class UnifiedRequest(BaseModel):
             elif "input" in values:
                 values["data"] = ModerationRequest(**values)
                 values["data"].request_type = "moderation"
             else:
                 raise ValueError("无法确定请求类型")
         return values

     size: Optional[str] = "1024x1024"
     stream: bool = False
+class EmbeddingRequest(BaseRequest):
+    input: str
+    model: str
+    encoding_format: Optional[str] = "float"
+    stream: bool = False
 class AudioTranscriptionRequest(BaseRequest):
     file: Tuple[str, IOBase, str]
     model: str
     stream: bool = False
 class UnifiedRequest(BaseModel):
+    data: Union[RequestModel, ImageGenerationRequest, AudioTranscriptionRequest, ModerationRequest, EmbeddingRequest]
     @model_validator(mode='before')
     @classmethod
             elif "input" in values:
                 values["data"] = ModerationRequest(**values)
                 values["data"].request_type = "moderation"
+            elif "input" in values:
+                values["data"] = EmbeddingRequest(**values)
+                values["data"].request_type = "embedding"
             else:
                 raise ValueError("无法确定请求类型")
         return values

request.py CHANGED Viewed

@@ -1125,6 +1125,27 @@ async def get_moderation_payload(request, engine, provider):
     return url, headers, payload
 async def get_payload(request: RequestModel, engine, provider):
     if engine == "gemini":
         return await get_gemini_payload(request, engine, provider)
@@ -1150,5 +1171,7 @@ async def get_payload(request: RequestModel, engine, provider):
         return await get_whisper_payload(request, engine, provider)
     elif engine == "moderation":
         return await get_moderation_payload(request, engine, provider)
     else:
         raise ValueError("Unknown payload")

     return url, headers, payload
+async def get_embedding_payload(request, engine, provider):
+    model_dict = get_model_dict(provider)
+    model = model_dict[request.model]
+    headers = {
+        "Content-Type": "application/json",
+    }
+    if provider.get("api"):
+        headers['Authorization'] = f"Bearer {await provider_api_circular_list[provider['provider']].next()}"
+    url = provider['base_url']
+    url = BaseAPI(url).embeddings
+    payload = {
+        "input": request.input,
+        "model": model,
+    }
+    if request.encoding_format:
+        payload["encoding_format"] = request.encoding_format
+    return url, headers, payload
 async def get_payload(request: RequestModel, engine, provider):
     if engine == "gemini":
         return await get_gemini_payload(request, engine, provider)
         return await get_whisper_payload(request, engine, provider)
     elif engine == "moderation":
         return await get_moderation_payload(request, engine, provider)
+    elif engine == "embedding":
+        return await get_embedding_payload(request, engine, provider)
     else:
         raise ValueError("Unknown payload")

utils.py CHANGED Viewed

@@ -377,6 +377,7 @@ class BaseAPI:
         self.image_url: str = urlunparse(parsed_url[:2] + (before_v1 + "/v1/images/generations",) + ("",) * 3)
         self.audio_transcriptions: str = urlunparse(parsed_url[:2] + (before_v1 + "/v1/audio/transcriptions",) + ("",) * 3)
         self.moderations: str = urlunparse(parsed_url[:2] + (before_v1 + "/v1/moderations",) + ("",) * 3)
 def safe_get(data, *keys, default=None):
     for key in keys:

         self.image_url: str = urlunparse(parsed_url[:2] + (before_v1 + "/v1/images/generations",) + ("",) * 3)
         self.audio_transcriptions: str = urlunparse(parsed_url[:2] + (before_v1 + "/v1/audio/transcriptions",) + ("",) * 3)
         self.moderations: str = urlunparse(parsed_url[:2] + (before_v1 + "/v1/moderations",) + ("",) * 3)
+        self.embeddings: str = urlunparse(parsed_url[:2] + (before_v1 + "/v1/embeddings",) + ("",) * 3)
 def safe_get(data, *keys, default=None):
     for key in keys: