dict: 注音;修订 fix #383, fix #384

This commit is contained in:
Dvel 2023-07-02 20:59:26 +08:00
parent 590ee64c04
commit 7764f6d024
13 changed files with 54026 additions and 56647 deletions

View File

@ -35,7 +35,7 @@
# 「地 de di」这种不好用固定词组区分的全部注音。 # 「地 de di」这种不好用固定词组区分的全部注音。
--- ---
name: 8105 name: 8105
version: "2023-06-13" version: "2023-07-02"
sort: by_weight sort: by_weight
... ...
### 按需启用 ### 按需启用
@ -1487,7 +1487,7 @@ sort: by_weight
躲 duo 249450 躲 duo 249450
朵 duo 202374 朵 duo 202374
夺 duo 175135 夺 duo 175135
度 duo 49671 度 duo 50671
堕 duo 30285 堕 duo 30285
哆 duo 30257 哆 duo 30257
跺 duo 20222 跺 duo 20222
@ -2371,13 +2371,13 @@ sort: by_weight
护 hu 551817 护 hu 551817
胡 hu 468131 胡 hu 468131
虎 hu 391382 虎 hu 391382
和 hu 375122
湖 hu 327739 湖 hu 327739
糊 hu 235912 糊 hu 235912
户 hu 227191 户 hu 227191
互 hu 215472 互 hu 215472
狐 hu 139523 狐 hu 139523
壶 hu 45112 壶 hu 45112
和 hu 41260
蝴 hu 33327 蝴 hu 33327
惚 hu 28986 惚 hu 28986
弧 hu 25808 弧 hu 25808
@ -2577,13 +2577,13 @@ sort: by_weight
活 huo 1317244 活 huo 1317244
火 huo 1180390 火 huo 1180390
伙 huo 518273 伙 huo 518273
和 huo 375122
获 huo 245741 获 huo 245741
惑 huo 217812 惑 huo 217812
货 huo 161159 货 huo 161159
祸 huo 100219 祸 huo 100219
霍 huo 91016 霍 huo 91016
豁 huo 26107 豁 huo 26107
和 huo 4126
夥 huo 3748 夥 huo 3748
嚯 huo 2371 嚯 huo 2371
藿 huo 435 藿 huo 435
@ -5500,7 +5500,7 @@ sort: by_weight
杉 sha 1 杉 sha 1
晒 shai 3043700 晒 shai 3043700
筛 shai 788300 筛 shai 788300
色 shai 119311 色 shai 1193
山 shan 1526952 山 shan 1526952
删 shan 1112335 删 shan 1112335
闪 shan 551016 闪 shan 551016

File diff suppressed because it is too large Load Diff

File diff suppressed because it is too large Load Diff

View File

@ -14,8 +14,6 @@ sort: by_weight
##### 容错词 ##### 容错词
# 「血xue、xie」「谁shui、shei」「露lu、lou」「熟shu、shou」「密钥yao、yue」已在 base 中实现 # 「血xue、xie」「谁shui、shei」「露lu、lou」「熟shu、shou」「密钥yao、yue」已在 base 中实现
# --- # ---
雪佛兰 xue fo lan
雪佛兰 xue fu lan
# 「馄饨」,正确是 tun北方口语是 dun # 「馄饨」,正确是 tun北方口语是 dun
馄饨 hun tun 馄饨 hun tun
馄饨 hun dun 馄饨 hun dun

File diff suppressed because it is too large Load Diff

View File

@ -7,7 +7,7 @@
# #
--- ---
name: en_ext name: en_ext
version: "2023-07-01" version: "2023-07-02"
sort: by_weight sort: by_weight
... ...
# 一些杂项 # 一些杂项
@ -15,8 +15,6 @@ sort: by_weight
<br> <br> <br> <br>
.DS_Store .DS_Store .DS_Store .DS_Store
README.md README.md README.md README.md
唵嘛呢叭咪吽 ongmanibeimeihong
唵嘛呢嘛呢叭咪吽 ongmanimanibeimeihong
# 按键 # 按键
@ -2221,3 +2219,4 @@ Maeve Maeve
hyphen hyphen hyphen hyphen
Oppenheimer Oppenheimer Oppenheimer Oppenheimer
UltraEdit UltraEdit UltraEdit UltraEdit
GoldenDict GoldenDict

View File

@ -186,6 +186,7 @@ respect respect 🫡
唉 唉 😮‍💨 唉 唉 😮‍💨
无奈 无奈 😮‍💨 无奈 无奈 😮‍💨
长鼻子 长鼻子 🤥 长鼻子 长鼻子 🤥
长鼻 长鼻 🤥
匹诺曹 匹诺曹 🤥 匹诺曹 匹诺曹 🤥
说谎 说谎 🤥 说谎 说谎 🤥
撒谎 撒谎 🤥 撒谎 撒谎 🤥
@ -193,6 +194,7 @@ respect respect 🫡
胡说 胡说 🤥 胡说 胡说 🤥
骗人 骗人 🤥 骗人 骗人 🤥
骗人布 骗人布 🤥 骗人布 骗人布 🤥
乌索普 乌索普 🤥
摇头 摇头 🫨 摇头 摇头 🫨
晃脑 晃脑 🫨 晃脑 晃脑 🫨
摇头晃脑 摇头晃脑 🫨 摇头晃脑 摇头晃脑 🫨
@ -227,6 +229,7 @@ respect respect 🫡
量体温 量体温 🤒 量体温 量体温 🤒
发烧 发烧 🤒 发烧 发烧 🤒
受伤 受伤 🤕 ❤️‍🩹 受伤 受伤 🤕 ❤️‍🩹
负伤 负伤 🤕
绷带 绷带 🤕 绷带 绷带 🤕
缠绷带 缠绷带 🤕 缠绷带 缠绷带 🤕
缠满绷带 缠满绷带 🤕 缠满绷带 缠满绷带 🤕

View File

@ -616,6 +616,7 @@
佐山爱 佐山爱 佐山愛 佐山爱 佐山爱 佐山愛
佐佐木明希 佐佐木明希 佐々木あき 佐佐木明希 佐佐木明希 佐々木あき
松本梨穗 松本梨穗 松本梨穂 松本梨穗 松本梨穗 松本梨穂
佐野由真 佐野由真 佐野ゆま
----------生活大爆炸&老友记 ---------- ----------生活大爆炸&老友记 ----------
谢耳朵 谢耳朵 Sheldon 谢耳朵 谢耳朵 Sheldon
谢尔顿 谢尔顿 Sheldon 谢尔顿 谢尔顿 Sheldon

View File

@ -1,7 +1,7 @@
# Emoji 映射表 # Emoji 映射表
# 根据此文件生成 emoji.txt # 根据此文件生成 emoji.txt
# #
# version: "2023-07-01" # version: "2023-07-02"
# #
# 中文映射由 Dvel 纯手工打造 https://github.com/iDvel/rime-ice # 中文映射由 Dvel 纯手工打造 https://github.com/iDvel/rime-ice
# #
@ -81,7 +81,7 @@ S$ 新加坡元 新加坡币
🙄 白眼 白眼儿 翻白眼 翻白眼儿 🙄 白眼 白眼儿 翻白眼 翻白眼儿
😬 咬牙切齿 龇牙咧嘴 😬 咬牙切齿 龇牙咧嘴
😮‍💨 呼气 叹气 唉 无奈 😮‍💨 呼气 叹气 唉 无奈
🤥 长鼻子 匹诺曹 说谎 撒谎 乱讲 胡说 骗人 骗人布 🤥 长鼻子 长鼻 匹诺曹 说谎 撒谎 乱讲 胡说 骗人 骗人布 乌索普
🫨 摇头 晃脑 摇头晃脑 颤抖的脸 猛摇头 🫨 摇头 晃脑 摇头晃脑 颤抖的脸 猛摇头
# face-sleepy # face-sleepy
😌 如释重负 松了口气 松口气 释然 😌 如释重负 松了口气 松口气 释然
@ -92,7 +92,7 @@ S$ 新加坡元 新加坡币
# face-unwell # face-unwell
😷 口罩 戴口罩 感冒 生病 😷 口罩 戴口罩 感冒 生病
🤒 体温计 量体温 发烧 🤒 体温计 量体温 发烧
🤕 受伤 绷带 缠绷带 缠满绷带 🤕 受伤 负伤 绷带 缠绷带 缠满绷带
🤢 恶心 想吐 反胃 🤢 恶心 想吐 反胃
🤮 吐 吐了 呕吐 吐出来 🤮 吐 吐了 呕吐 吐出来
🤧 喷嚏 打喷嚏 鼻涕 擤鼻涕 擤鼻子 感冒 鼻炎 🤧 喷嚏 打喷嚏 鼻涕 擤鼻涕 擤鼻子 感冒 鼻炎

View File

@ -4,16 +4,22 @@ import (
"fmt" "fmt"
"log" "log"
"os" "os"
"path/filepath"
"script/rime" "script/rime"
"strings" "strings"
) )
func main() { func main() {
log.SetFlags(log.LstdFlags | log.Lshortfile) log.SetFlags(log.LstdFlags | log.Lshortfile)
if len(os.Args) > 1 {
if len(os.Args) > 1 && os.Args[1] == "sort" { if os.Args[1] == "sort" {
goto SORT goto SORT
} }
if os.Args[1] == "temp" {
rime.Pinyin(filepath.Join(rime.RimeDir, "cn_dicts/temp"))
return
}
}
// 临时 // 临时
rime.Temp() rime.Temp()

View File

@ -31,6 +31,7 @@ var onlyOne = map[string]string{
"谁": "shei", "谁": "shei",
"血": "xue", "血": "xue",
"熟": "shu", "熟": "shu",
"露": "lu",
"掴": "guai", "掴": "guai",
"棽": "shen", "棽": "shen",
"爪": "zhua", "爪": "zhua",
@ -42,6 +43,9 @@ var onlyOne = map[string]string{
"公钥": "gong yao", "公钥": "gong yao",
"私钥": "si yao", "私钥": "si yao",
"甲壳": "jia ke", "甲壳": "jia ke",
"掉色": "diao se",
"变色": "bian se",
"上色": "shang se",
// 其他多音字,指定唯一读音 // 其他多音字,指定唯一读音
"核儿": "he er", "核儿": "he er",
"核": "he", "核": "he",
@ -68,6 +72,8 @@ var onlyOne = map[string]string{
"摩": "mo", "摩": "mo",
"澄清": "cheng qing", "澄清": "cheng qing",
"澄": "cheng", "澄": "cheng",
"出车": "chu che",
"车": "che",
"伯": "bo", "伯": "bo",
"胖": "pang", "胖": "pang",
"南": "nan", "南": "nan",
@ -179,7 +185,6 @@ var onlyOne = map[string]string{
"喋": "die", "喋": "die",
"句": "ju", "句": "ju",
"杉": "shan", "杉": "shan",
"车": "che",
"臭": "chou", "臭": "chou",
"禅": "chan", "禅": "chan",
"埋": "mai", "埋": "mai",
@ -238,7 +243,7 @@ func init() {
continue continue
} }
parts := strings.Split(line, "\t") parts := strings.Split(line, "\t")
if len(parts) < 2 || !isAllLower(parts[1]) { if len(parts) != 3 || !isAllLower(parts[1]) {
continue continue
} }
text, code := parts[0], parts[1] text, code := parts[0], parts[1]
@ -282,6 +287,9 @@ func Pinyin(dictPath string) {
// 遍历、注音 // 遍历、注音
isMark := false isMark := false
for i, line := range lines { for i, line := range lines {
if strings.Contains(dictPath, "temp") {
isMark = true
}
if !isMark { if !isMark {
if strings.HasPrefix(line, mark) { if strings.HasPrefix(line, mark) {
isMark = true isMark = true

View File

@ -1,4 +1,21 @@
# 在 # -_- 上面是错词;下面是包含错词但不是错词。 # 在 # -_- 上面是错词;下面是包含错词但不是错词。
阿弗洛狄忒
阿芙洛狄忒
阿芙罗狄忒
二人传
剧乐部
聚乐部
蒲京
新普京
萄京
浦京
莆京
百佬汇
余乐
乐此不彼
博人转
体重称
长劲鹿
怎幺 怎幺
替天行盗 替天行盗
侣行 侣行

View File

@ -30,35 +30,111 @@
大夫 大夫
# 会 kuai # 会 kuai
会计 会计
# 地 di de 全部注音 # 地 di de 全部注音
# 行 xing hang 全部注音 # 行 xing hang heng 全部注音
# 车 ju
车马炮
丢车
保车
舍车
死车
高车
列马车
骑河车
巡河车
双车错
贴将车
象位车
一车换二
一车换双
# 合 ge
# 区 ou
区楚良
区大相
区瑞强
区霭玲
区俊炫
区诺轩
区寿年
区晓鸥
区永权
区适子
# 色 shai
# base 已注音同义多音字「褪色、上色、掉色」的 shai 和 se其余一律使用 se
色子
落色
捎色
糖色
色酒
# 长 chang zhang (全部注音)
# 度 du duo (全部注音)
# 重 zhong chong (全部注音)
# 了 le liao (全部注音)
# 无 mo
南无
# 数 8024
频数
数见不鲜
# 和 huo hu
和了
天和
地和
人和
对对和
和不了
和牌
平和
弃和
荣和
自摸和
和弄
和稀泥
拌和
掺和
和面
和泥
搅和
暖和
热和软和
匀和
杂和菜
# 员 yun
伍员
# 术 zhu
白术
苍术
莪术
# 乐 le yue lao (全部注音)
# 系 xi ji (全部注音)
# 期 ji
期年
期月
# 强 jiang
倔强
倔头强脑
木强敦厚
木强少文
# 南 na
南无
# 价 6138
别价
甭价
不价
# 传 chuan zhuan (全部注音)
# 待处理的多音字: # 待处理的多音字:
# tencent 词库一共约有 484039 个多音字 # tencent 词库一共约有 484039 个多音字
# 多音字 | 个数: # 多音字 | 个数:
# 车 12344
# 合 11511
# 区 10819
# 色 10642
# 长 10203
# 度 9828
# 重 8780
# 了 8485
# 无 8226
# 数 8024
# 和 7766
# 员 7681
# 术 7591
# 乐 7489
# 系 7162
# 期 7071
# 强 6297
# 南 6275
# 价 6138
# 传 6109
# 单 5947 # 单 5947
# 得 5820 # 得 5820
# 提 5704 # 提 5704