36 lines
948 B
Lua
36 lines
948 B
Lua
-- 为中英混输词条(cn_en.dict.yaml)自动空格
|
||
-- 示例:`VIP中P` → `VIP 中 P`
|
||
--
|
||
-- ChatGPT 写的
|
||
|
||
local function add_spaces(s)
|
||
-- 在中文字符后和英文字符前插入空格
|
||
s = s:gsub("([\228-\233][\128-\191]-)([%w%p])", "%1 %2")
|
||
-- 在英文字符后和中文字符前插入空格
|
||
s = s:gsub("([%w%p])([\228-\233][\128-\191]-)", "%1 %2")
|
||
return s
|
||
end
|
||
|
||
local function is_mixed_cn_en_num(s)
|
||
-- 检查是否含有中文
|
||
if not s:find("([\228-\233][\128-\191]-)") then
|
||
return false
|
||
end
|
||
-- 检查是否含有英文或数字
|
||
if not s:find("[%a%d]") then
|
||
return false
|
||
end
|
||
return true
|
||
end
|
||
|
||
local function cn_en_spacer(input, env)
|
||
for cand in input:iter() do
|
||
if is_mixed_cn_en_num(cand.text) then
|
||
cand = cand:to_shadow_candidate(cand.type, add_spaces(cand.text), cand.comment)
|
||
end
|
||
yield(cand)
|
||
end
|
||
end
|
||
|
||
return cn_en_spacer
|