2023-06-07 11:47:19 +02:00
|
|
|
|
-- 为中英混输词条(cn_en.dict.yaml)自动空格
|
|
|
|
|
-- 示例:`VIP中P` → `VIP 中 P`
|
|
|
|
|
--
|
|
|
|
|
-- ChatGPT 写的
|
|
|
|
|
|
|
|
|
|
local function add_spaces(s)
|
|
|
|
|
-- 在中文字符后和英文字符前插入空格
|
|
|
|
|
s = s:gsub("([\228-\233][\128-\191]-)([%w%p])", "%1 %2")
|
|
|
|
|
-- 在英文字符后和中文字符前插入空格
|
|
|
|
|
s = s:gsub("([%w%p])([\228-\233][\128-\191]-)", "%1 %2")
|
|
|
|
|
return s
|
|
|
|
|
end
|
|
|
|
|
|
2023-06-15 16:21:06 +02:00
|
|
|
|
-- 是否同时包含中文和英文数字
|
2023-06-07 11:47:19 +02:00
|
|
|
|
local function is_mixed_cn_en_num(s)
|
2023-06-15 16:21:06 +02:00
|
|
|
|
return s:find("([\228-\233][\128-\191]-)") and s:find("[%a%d]")
|
2023-06-07 11:47:19 +02:00
|
|
|
|
end
|
|
|
|
|
|
|
|
|
|
local function cn_en_spacer(input, env)
|
|
|
|
|
for cand in input:iter() do
|
|
|
|
|
if is_mixed_cn_en_num(cand.text) then
|
|
|
|
|
cand = cand:to_shadow_candidate(cand.type, add_spaces(cand.text), cand.comment)
|
|
|
|
|
end
|
|
|
|
|
yield(cand)
|
|
|
|
|
end
|
|
|
|
|
end
|
|
|
|
|
|
|
|
|
|
return cn_en_spacer
|