Merge pull request #1592 from YOOkoishi/feat-add-volcengine-support

✨ feat: add volcengine support
2025-05-20 13:58:44 +08:00
parent 66dd4e28ad 939dc1b0fb
commit f894ecf3b6
3 changed files with 144 additions and 0 deletions
@@ -847,8 +847,41 @@ CONFIG_METADATA_2 = {
                        "minimax-voice-english-normalization": False,
                        "timeout": 20,
                    },
+                    "火山引擎_TTS(API)": {
+                        "id": "volcengine_tts",
+                        "type": "volcengine_tts",
+                        "provider_type": "text_to_speech",
+                        "enable": False,
+                        "api_key": "",
+                        "appid": "",
+                        "volcengine_cluster": "",
+                        "volcengine_voice_type": "",
+                        "volcengine_speed_ratio": 1.0,
+                        "api_base": "https://openspeech.bytedance.com/api/v1/tts",
+                        "timeout": 20,
+                    },
                },
                "items": {
+                    "volcengine_cluster": {
+                        "type": "string",
+                        "description": "火山引擎集群",
+                        "hint": "可选volcano_icl或volcano_icl_concurr"
+                    },
+                    "volcengine_voice_type": {
+                        "type": "string",
+                        "description": "火山引擎音色",
+                        "hint": "输入S_开头的声音id(SpeakerId)"
+                    },
+                    "volcengine_speed_ratio": {
+                        "type": "float",
+                        "description": "语速设置",
+                        "hint": "语速设置，范围为 0.2 到 3.0,默认值为 1.0"
+                    },
+                    "volcengine_volume_ratio": {
+                        "type": "float",
+                        "description": "音量设置",
+                        "hint": "音量设置，范围为 0.0 到 2.0,默认值为 1.0"
+                    },
                    "azure_tts_voice": {
                        "type": "string",
                        "description": "音色设置",
@@ -210,6 +210,10 @@ class ProviderManager:
                    from .sources.minimax_tts_api_source import (
                        ProviderMiniMaxTTSAPI as ProviderMiniMaxTTSAPI,
                    )
+                case "volcengine_tts":
+                    from .sources.volcengine_tts import (
+                        ProviderVolcengineTTS as ProviderVolcengineTTS,
+                    )
        except (ImportError, ModuleNotFoundError) as e:
            logger.critical(
                f"加载 {provider_config['type']}({provider_config['id']}) 提供商适配器失败：{e}。可能是因为有未安装的依赖。"
@@ -0,0 +1,107 @@
+import uuid
+import base64
+import json
+import os
+import traceback
+import asyncio
+import aiohttp
+import requests
+from ..provider import TTSProvider
+from ..entities import ProviderType
+from ..register import register_provider_adapter
+from astrbot import logger
+
+@register_provider_adapter(
+    "volcengine_tts", "火山引擎 TTS", provider_type=ProviderType.TEXT_TO_SPEECH
+)
+class ProviderVolcengineTTS(TTSProvider):
+    def __init__(self, provider_config: dict, provider_settings: dict) -> None:
+        super().__init__(provider_config, provider_settings)
+        self.api_key = provider_config.get("api_key", "")
+        self.appid = provider_config.get("appid", "")
+        self.cluster = provider_config.get("volcengine_cluster", "")
+        self.voice_type = provider_config.get("volcengine_voice_type", "")
+        self.speed_ratio = provider_config.get("volcengine_speed_ratio", 1.0)
+        self.api_base = provider_config.get("api_base", f"https://openspeech.bytedance.com/api/v1/tts")
+        self.timeout = provider_config.get("timeout", 20)
+
+    def _build_request_payload(self, text: str) -> dict:
+        return {
+            "app": {
+                "appid": self.appid,
+                "token": self.api_key,
+                "cluster": self.cluster
+            },
+            "user": {
+                "uid": str(uuid.uuid4())  
+            },
+            "audio": {
+                "voice_type": self.voice_type,
+                "encoding": "mp3",
+                "speed_ratio": self.speed_ratio,
+                "volume_ratio": 1.0,
+                "pitch_ratio": 1.0,
+            },
+            "request": {
+                "reqid": str(uuid.uuid4()),
+                "text": text,
+                "text_type": "plain",
+                "operation": "query",
+                "with_frontend": 1,
+                "frontend_type": "unitTson"
+            }
+        }
+
+    async def get_audio(self, text: str) -> str:
+        """异步方法获取语音文件路径"""
+        headers = {
+            "Content-Type": "application/json",
+            "Authorization": f"Bearer; {self.api_key}"
+        }
+        
+        payload = self._build_request_payload(text)
+        
+        logger.debug(f"请求头: {headers}")
+        logger.debug(f"请求 URL: {self.api_base}")
+        logger.debug(f"请求体: {json.dumps(payload, ensure_ascii=False)[:100]}...")
+        
+        try:
+            async with aiohttp.ClientSession() as session:
+                async with session.post(
+                    self.api_base,
+                    data=json.dumps(payload), 
+                    headers=headers,
+                    timeout=self.timeout
+                ) as response:
+                    logger.debug(f"响应状态码: {response.status}")
+                    
+                    response_text = await response.text()
+                    logger.debug(f"响应内容: {response_text[:200]}...")
+                    
+                    if response.status == 200:
+                        resp_data = json.loads(response_text)
+                        
+                        if "data" in resp_data:
+                            audio_data = base64.b64decode(resp_data["data"])
+                            
+                            os.makedirs("data/temp", exist_ok=True)
+                            
+                            file_path = f"data/temp/volcengine_tts_{uuid.uuid4()}.mp3"
+                            
+                            loop = asyncio.get_running_loop()
+                            await loop.run_in_executor(
+                                None, 
+                                lambda: open(file_path, "wb").write(audio_data)
+                            )
+                            
+                            return file_path
+                        else:
+                            error_msg = resp_data.get("message", "未知错误")
+                            raise Exception(f"火山引擎 TTS API 返回错误: {error_msg}")
+                    else:
+                        raise Exception(f"火山引擎 TTS API 请求失败: {response.status}, {response_text}")
+        
+        except Exception as e:
+            error_details = traceback.format_exc()
+            logger.debug(f"火山引擎 TTS 异常详情: {error_details}")
+            raise Exception(f"火山引擎 TTS 异常: {str(e)}")