dict: 日常更新
This commit is contained in:
parent
6a1c50649f
commit
bd2b6ba021
@ -33,7 +33,7 @@
|
|||||||
# 需要注音的字词设定在 others/script/rime/需要注音.txt
|
# 需要注音的字词设定在 others/script/rime/需要注音.txt
|
||||||
---
|
---
|
||||||
name: 8105
|
name: 8105
|
||||||
version: "2023-08-27"
|
version: "2023-09-03"
|
||||||
sort: by_weight
|
sort: by_weight
|
||||||
...
|
...
|
||||||
### 按需启用
|
### 按需启用
|
||||||
@ -3327,6 +3327,7 @@ sort: by_weight
|
|||||||
柯 ke 71973
|
柯 ke 71973
|
||||||
棵 ke 58780
|
棵 ke 58780
|
||||||
壳 ke 41877
|
壳 ke 41877
|
||||||
|
氪 ke 35000
|
||||||
磕 ke 34654
|
磕 ke 34654
|
||||||
嗑 ke 31720
|
嗑 ke 31720
|
||||||
珂 ke 16769
|
珂 ke 16769
|
||||||
@ -3346,7 +3347,6 @@ sort: by_weight
|
|||||||
髁 ke 232
|
髁 ke 232
|
||||||
骒 ke 91
|
骒 ke 91
|
||||||
缂 ke 79
|
缂 ke 79
|
||||||
氪 ke 30
|
|
||||||
牁 ke 14
|
牁 ke 14
|
||||||
匼 ke 3
|
匼 ke 3
|
||||||
炣 ke 0
|
炣 ke 0
|
||||||
@ -8194,6 +8194,7 @@ sort: by_weight
|
|||||||
至 zhi 1199059
|
至 zhi 1199059
|
||||||
之 zhi 1173763
|
之 zhi 1173763
|
||||||
指 zhi 1099010
|
指 zhi 1099010
|
||||||
|
值 zhi 920306
|
||||||
制 zhi 870792
|
制 zhi 870792
|
||||||
支 zhi 532396
|
支 zhi 532396
|
||||||
志 zhi 485065
|
志 zhi 485065
|
||||||
@ -8203,7 +8204,6 @@ sort: by_weight
|
|||||||
置 zhi 379704
|
置 zhi 379704
|
||||||
致 zhi 370734
|
致 zhi 370734
|
||||||
职 zhi 326699
|
职 zhi 326699
|
||||||
值 zhi 320306
|
|
||||||
智 zhi 310406
|
智 zhi 310406
|
||||||
纸 zhi 273013
|
纸 zhi 273013
|
||||||
织 zhi 218959
|
织 zhi 218959
|
||||||
|
File diff suppressed because it is too large
Load Diff
File diff suppressed because it is too large
Load Diff
@ -8,7 +8,7 @@
|
|||||||
#
|
#
|
||||||
---
|
---
|
||||||
name: others
|
name: others
|
||||||
version: "2023-08-15"
|
version: "2023-09-03"
|
||||||
sort: by_weight
|
sort: by_weight
|
||||||
...
|
...
|
||||||
##### 容错词
|
##### 容错词
|
||||||
@ -142,6 +142,8 @@ sort: by_weight
|
|||||||
太行山 tai xing shan
|
太行山 tai xing shan
|
||||||
歇斯底里 xie si di li
|
歇斯底里 xie si di li
|
||||||
歇斯底里 jie si di li
|
歇斯底里 jie si di li
|
||||||
|
暖和 nuan huo
|
||||||
|
暖和 nuan he
|
||||||
### 错字
|
### 错字
|
||||||
曾经 ceng jing
|
曾经 ceng jing
|
||||||
曾今 ceng jin
|
曾今 ceng jin
|
||||||
|
File diff suppressed because it is too large
Load Diff
@ -7,7 +7,7 @@
|
|||||||
#
|
#
|
||||||
---
|
---
|
||||||
name: en_ext
|
name: en_ext
|
||||||
version: "2023-08-27"
|
version: "2023-09-03"
|
||||||
sort: by_weight
|
sort: by_weight
|
||||||
...
|
...
|
||||||
# 一些杂项
|
# 一些杂项
|
||||||
@ -1644,9 +1644,7 @@ Windows Windows
|
|||||||
Microsoft Microsoft
|
Microsoft Microsoft
|
||||||
Nintendo Nintendo
|
Nintendo Nintendo
|
||||||
Google Google
|
Google Google
|
||||||
Nexus Nexus
|
|
||||||
nexus nexus
|
nexus nexus
|
||||||
Pixel Pixel
|
|
||||||
Wii U WiiU
|
Wii U WiiU
|
||||||
Wii Wii
|
Wii Wii
|
||||||
Oracle Oracle
|
Oracle Oracle
|
||||||
@ -2262,3 +2260,6 @@ C# C#
|
|||||||
C# Csharp
|
C# Csharp
|
||||||
C# Cjing
|
C# Cjing
|
||||||
decode decode
|
decode decode
|
||||||
|
KeyCastr KeyCastr
|
||||||
|
Laugh Tale LaughTale
|
||||||
|
Joy Boy JoyBoy
|
||||||
|
@ -71,6 +71,7 @@ local corrections = {
|
|||||||
["tiao huan"] = { text = "调换", comment = "diao huan" },
|
["tiao huan"] = { text = "调换", comment = "diao huan" },
|
||||||
["tai xing shan"] = { text = "太行山", comment = "tai hang shan" },
|
["tai xing shan"] = { text = "太行山", comment = "tai hang shan" },
|
||||||
["jie si di li"] = { text = "歇斯底里", comment = "xie si di li" },
|
["jie si di li"] = { text = "歇斯底里", comment = "xie si di li" },
|
||||||
|
["nuan he"] = { text = "暖和", comment = "nuan huo" },
|
||||||
-- 错字
|
-- 错字
|
||||||
["ceng jin"] = { text = "曾今", comment = "曾经" },
|
["ceng jin"] = { text = "曾今", comment = "曾经" },
|
||||||
["an nai"] = { text = "按耐", comment = "按捺(na)" },
|
["an nai"] = { text = "按耐", comment = "按捺(na)" },
|
||||||
|
@ -210,8 +210,10 @@ respect respect 🫡
|
|||||||
忧虑 忧虑 😔
|
忧虑 忧虑 😔
|
||||||
忧伤 忧伤 😔
|
忧伤 忧伤 😔
|
||||||
困 困 😪 🥱
|
困 困 😪 🥱
|
||||||
|
困困 困困 😪
|
||||||
困了 困了 😪 🥱
|
困了 困了 😪 🥱
|
||||||
困倦 困倦 😪 🥱
|
困倦 困倦 😪 🥱
|
||||||
|
困乏 困乏 😪
|
||||||
瞌睡 瞌睡 😪
|
瞌睡 瞌睡 😪
|
||||||
打瞌睡 打瞌睡 😪
|
打瞌睡 打瞌睡 😪
|
||||||
口水 口水 🤤
|
口水 口水 🤤
|
||||||
@ -509,6 +511,8 @@ angry angry 😡 😠 💢
|
|||||||
送你一颗心 送你一颗心 💝
|
送你一颗心 送你一颗心 💝
|
||||||
闪亮的心 闪亮的心 💖
|
闪亮的心 闪亮的心 💖
|
||||||
爱心 爱心 💖 ♥️
|
爱心 爱心 💖 ♥️
|
||||||
|
感谢 感谢 💖 🙏
|
||||||
|
谢谢 谢谢 💖 🙏
|
||||||
膨胀的心 膨胀的心 💗
|
膨胀的心 膨胀的心 💗
|
||||||
膨胀的爱心 膨胀的爱心 💗
|
膨胀的爱心 膨胀的爱心 💗
|
||||||
搏动的心 搏动的心 💗
|
搏动的心 搏动的心 💗
|
||||||
@ -816,7 +820,6 @@ OK OK 👌 🙆♂️ 🙆♀️ 🆗
|
|||||||
拜托 拜托 🙏
|
拜托 拜托 🙏
|
||||||
祈求 祈求 🙏
|
祈求 祈求 🙏
|
||||||
祈祷 祈祷 🙏
|
祈祷 祈祷 🙏
|
||||||
谢谢 谢谢 🙏
|
|
||||||
超度 超度 🙏
|
超度 超度 🙏
|
||||||
阿弥陀佛 阿弥陀佛 🙏
|
阿弥陀佛 阿弥陀佛 🙏
|
||||||
写字 写字 ✍️
|
写字 写字 ✍️
|
||||||
@ -2045,6 +2048,9 @@ bug bug 🐛
|
|||||||
鱼饼 鱼饼 🍥
|
鱼饼 鱼饼 🍥
|
||||||
鱼板 鱼板 🍥
|
鱼板 鱼板 🍥
|
||||||
月饼 月饼 🥮
|
月饼 月饼 🥮
|
||||||
|
月团 月团 🥮
|
||||||
|
丰收饼 丰收饼 🥮
|
||||||
|
团圆饼 团圆饼 🥮
|
||||||
团子 团子 🍡
|
团子 团子 🍡
|
||||||
糯米团 糯米团 🍡
|
糯米团 糯米团 🍡
|
||||||
饺子 饺子 🥟
|
饺子 饺子 🥟
|
||||||
@ -2096,6 +2102,8 @@ cookies cookies 🍪
|
|||||||
朱古力 朱古力 🍫
|
朱古力 朱古力 🍫
|
||||||
朱古力棒 朱古力棒 🍫
|
朱古力棒 朱古力棒 🍫
|
||||||
糖果 糖果 🍬
|
糖果 糖果 🍬
|
||||||
|
糖 糖 🍬
|
||||||
|
吃糖 吃糖 🍬
|
||||||
棒棒糖 棒棒糖 🍭
|
棒棒糖 棒棒糖 🍭
|
||||||
蛋奶糕 蛋奶糕 🍮
|
蛋奶糕 蛋奶糕 🍮
|
||||||
甜品 甜品 🍮
|
甜品 甜品 🍮
|
||||||
@ -2104,14 +2112,17 @@ cookies cookies 🍪
|
|||||||
蜜罐 蜜罐 🍯
|
蜜罐 蜜罐 🍯
|
||||||
蜂蜜 蜂蜜 🍯
|
蜂蜜 蜂蜜 🍯
|
||||||
奶瓶 奶瓶 🍼
|
奶瓶 奶瓶 🍼
|
||||||
|
喝奶 喝奶 🍼
|
||||||
一杯奶 一杯奶 🥛
|
一杯奶 一杯奶 🥛
|
||||||
牛奶杯 牛奶杯 🥛
|
牛奶杯 牛奶杯 🥛
|
||||||
牛奶 牛奶 🥛
|
牛奶 牛奶 🥛
|
||||||
杯子 杯子 🥛
|
杯子 杯子 🥛
|
||||||
玻璃杯 玻璃杯 🥛
|
|
||||||
咖啡 咖啡 ☕
|
咖啡 咖啡 ☕
|
||||||
咖啡杯 咖啡杯 ☕
|
咖啡杯 咖啡杯 ☕
|
||||||
|
喝咖啡 喝咖啡 ☕
|
||||||
茶壶 茶壶 🫖
|
茶壶 茶壶 🫖
|
||||||
|
一壶茶 一壶茶 🫖
|
||||||
|
一壶 一壶 🫖
|
||||||
茶 茶 🍵
|
茶 茶 🍵
|
||||||
茶水 茶水 🍵
|
茶水 茶水 🍵
|
||||||
茶杯 茶杯 🍵
|
茶杯 茶杯 🍵
|
||||||
@ -2126,11 +2137,15 @@ cookies cookies 🍪
|
|||||||
热带水果饮料 热带水果饮料 🍹
|
热带水果饮料 热带水果饮料 🍹
|
||||||
水果饮料 水果饮料 🍹
|
水果饮料 水果饮料 🍹
|
||||||
果饮 果饮 🍹
|
果饮 果饮 🍹
|
||||||
|
冷饮 冷饮 🍹
|
||||||
啤酒 啤酒 🍺
|
啤酒 啤酒 🍺
|
||||||
干杯 干杯 🍻 🥂
|
干杯 干杯 🍻 🥂
|
||||||
碰杯 碰杯 🍻 🥂
|
碰杯 碰杯 🍻 🥂
|
||||||
威士忌 威士忌 🥃
|
威士忌 威士忌 🥃
|
||||||
平底杯 平底杯 🥃
|
平底杯 平底杯 🥃
|
||||||
|
一杯酒 一杯酒 🥃
|
||||||
|
一杯 一杯 🥃
|
||||||
|
玻璃杯 玻璃杯 🥃
|
||||||
倾倒液体 倾倒液体 🫗
|
倾倒液体 倾倒液体 🫗
|
||||||
倾倒 倾倒 🫗
|
倾倒 倾倒 🫗
|
||||||
流出 流出 🫗
|
流出 流出 🫗
|
||||||
@ -2981,6 +2996,7 @@ T恤衫 T恤衫 👕
|
|||||||
钻戒 钻戒 💍
|
钻戒 钻戒 💍
|
||||||
求婚戒 求婚戒 💍
|
求婚戒 求婚戒 💍
|
||||||
订婚戒 订婚戒 💍
|
订婚戒 订婚戒 💍
|
||||||
|
星钻 星钻 💍
|
||||||
宝石 宝石 💎
|
宝石 宝石 💎
|
||||||
钻石 钻石 💎
|
钻石 钻石 💎
|
||||||
已静音的扬声器 已静音的扬声器 🔇
|
已静音的扬声器 已静音的扬声器 🔇
|
||||||
|
@ -1,7 +1,7 @@
|
|||||||
# Emoji 映射表
|
# Emoji 映射表
|
||||||
# 根据此文件生成 emoji.txt
|
# 根据此文件生成 emoji.txt
|
||||||
#
|
#
|
||||||
# version: 2023-08-27
|
# version: 2023-09-03
|
||||||
#
|
#
|
||||||
# 中文映射由 Dvel 纯手工打造 https://github.com/iDvel/rime-ice
|
# 中文映射由 Dvel 纯手工打造 https://github.com/iDvel/rime-ice
|
||||||
#
|
#
|
||||||
@ -86,7 +86,7 @@ S$ 新加坡元 新加坡币
|
|||||||
# face-sleepy
|
# face-sleepy
|
||||||
😌 如释重负 松了口气 松口气 释然
|
😌 如释重负 松了口气 松口气 释然
|
||||||
😔 低头忧伤 心事重重 忧虑 忧伤
|
😔 低头忧伤 心事重重 忧虑 忧伤
|
||||||
😪 困 困了 困倦 瞌睡 打瞌睡
|
😪 困 困困 困了 困倦 困乏 瞌睡 打瞌睡
|
||||||
🤤 口水 流口水 垂涎三尺
|
🤤 口水 流口水 垂涎三尺
|
||||||
😴 睡觉 睡着 睡着了 睡了 睡眠
|
😴 睡觉 睡着 睡着了 睡了 睡眠
|
||||||
# face-unwell
|
# face-unwell
|
||||||
@ -173,7 +173,7 @@ S$ 新加坡元 新加坡币
|
|||||||
💌 情书
|
💌 情书
|
||||||
💘 一箭穿心 丘比特 心中箭了
|
💘 一箭穿心 丘比特 心中箭了
|
||||||
💝 爱的礼物 系有缎带的心 饰以丝带的心 送你一颗心
|
💝 爱的礼物 系有缎带的心 饰以丝带的心 送你一颗心
|
||||||
💖 闪亮的心 爱心
|
💖 闪亮的心 爱心 感谢 谢谢
|
||||||
💗 膨胀的心 膨胀的爱心 搏动的心
|
💗 膨胀的心 膨胀的爱心 搏动的心
|
||||||
💓 心动 心跳 爱情 love
|
💓 心动 心跳 爱情 love
|
||||||
💞 旋转的心 舞动的心 心连心
|
💞 旋转的心 舞动的心 心连心
|
||||||
@ -254,7 +254,7 @@ S$ 新加坡元 新加坡币
|
|||||||
👐 双手张开 张开双手
|
👐 双手张开 张开双手
|
||||||
🤲 双手手掌向上 掌心向上托起 双手 捧着
|
🤲 双手手掌向上 掌心向上托起 双手 捧着
|
||||||
🤝 握手 合作 合作愉快 搞定
|
🤝 握手 合作 合作愉快 搞定
|
||||||
🙏 双手合十 合十 合掌 拜托 祈求 祈祷 求你了 求求你 求求你了 谢谢 超度 阿弥陀佛
|
🙏 双手合十 合十 合掌 拜托 祈求 祈祷 求你了 求求你 求求你了 感谢 谢谢 超度 阿弥陀佛
|
||||||
# hand-prop
|
# hand-prop
|
||||||
✍️ 写字 手写
|
✍️ 写字 手写
|
||||||
💅 指甲油 涂指甲油 美甲 做指甲 做美甲
|
💅 指甲油 涂指甲油 美甲 做指甲 做美甲
|
||||||
@ -847,7 +847,7 @@ S$ 新加坡元 新加坡币
|
|||||||
🍣 寿司
|
🍣 寿司
|
||||||
🍤 炸虾 天妇罗
|
🍤 炸虾 天妇罗
|
||||||
🍥 盘绕是炸鱼饼 鱼饼 鱼板
|
🍥 盘绕是炸鱼饼 鱼饼 鱼板
|
||||||
🥮 月饼
|
🥮 月饼 月团 丰收饼 团圆饼
|
||||||
🍡 团子 糯米团
|
🍡 团子 糯米团
|
||||||
🥟 饺子 水饺
|
🥟 饺子 水饺
|
||||||
🥠 幸运饼干
|
🥠 幸运饼干
|
||||||
@ -869,25 +869,25 @@ S$ 新加坡元 新加坡币
|
|||||||
🧁 纸杯蛋糕
|
🧁 纸杯蛋糕
|
||||||
🥧 派 油酥点心 点心
|
🥧 派 油酥点心 点心
|
||||||
🍫 巧克力 巧克力棒 朱古力 朱古力棒
|
🍫 巧克力 巧克力棒 朱古力 朱古力棒
|
||||||
🍬 糖果
|
🍬 糖果 糖 吃糖
|
||||||
🍭 棒棒糖
|
🍭 棒棒糖
|
||||||
🍮 蛋奶糕 甜品 甜点 布丁
|
🍮 蛋奶糕 甜品 甜点 布丁
|
||||||
🍯 蜜罐 蜂蜜
|
🍯 蜜罐 蜂蜜
|
||||||
# drink
|
# drink
|
||||||
🍼 奶瓶
|
🍼 奶瓶 喝奶
|
||||||
🥛 一杯奶 牛奶杯 牛奶 杯子 玻璃杯
|
🥛 一杯奶 牛奶杯 牛奶 杯子
|
||||||
☕ 咖啡 咖啡杯
|
☕ 咖啡 咖啡杯 喝咖啡
|
||||||
🫖 茶壶
|
🫖 茶壶 一壶茶 一壶
|
||||||
🍵 茶 茶水 茶杯
|
🍵 茶 茶水 茶杯
|
||||||
🍶 清酒
|
🍶 清酒
|
||||||
🍾 开香槟 香槟
|
🍾 开香槟 香槟
|
||||||
🍷 葡萄酒 酒杯 酒
|
🍷 葡萄酒 酒杯 酒
|
||||||
🍸 鸡尾酒
|
🍸 鸡尾酒
|
||||||
🍹 热带饮料 热带水果饮料 水果饮料 果饮
|
🍹 热带饮料 热带水果饮料 水果饮料 果饮 冷饮
|
||||||
🍺 啤酒
|
🍺 啤酒
|
||||||
🍻 干杯 碰杯
|
🍻 干杯 碰杯
|
||||||
🥂 干杯 碰杯
|
🥂 干杯 碰杯
|
||||||
🥃 威士忌 平底杯
|
🥃 威士忌 平底杯 一杯酒 一杯 玻璃杯
|
||||||
🫗 倾倒液体 倾倒 流出
|
🫗 倾倒液体 倾倒 流出
|
||||||
🥤 外带杯子 带吸管杯 吸管杯 饮料
|
🥤 外带杯子 带吸管杯 吸管杯 饮料
|
||||||
🧋 波霸奶茶 珍珠奶茶 奶茶 一杯奶茶
|
🧋 波霸奶茶 珍珠奶茶 奶茶 一杯奶茶
|
||||||
@ -1269,7 +1269,7 @@ S$ 新加坡元 新加坡币
|
|||||||
⛑️ 安全帽 白十字头盔 白十字安全帽 十字安全帽 十字头盔
|
⛑️ 安全帽 白十字头盔 白十字安全帽 十字安全帽 十字头盔
|
||||||
📿 念珠
|
📿 念珠
|
||||||
💄 口红 唇膏
|
💄 口红 唇膏
|
||||||
💍 戒指 钻戒 求婚戒 订婚戒
|
💍 戒指 钻戒 求婚戒 订婚戒 星钻
|
||||||
💎 宝石 钻石
|
💎 宝石 钻石
|
||||||
# sound
|
# sound
|
||||||
🔇 已静音的扬声器 扬声器关闭 静音
|
🔇 已静音的扬声器 扬声器关闭 静音
|
||||||
|
@ -11,19 +11,23 @@ import (
|
|||||||
|
|
||||||
func main() {
|
func main() {
|
||||||
log.SetFlags(log.LstdFlags | log.Lshortfile)
|
log.SetFlags(log.LstdFlags | log.Lshortfile)
|
||||||
|
|
||||||
if len(os.Args) > 1 {
|
if len(os.Args) > 1 {
|
||||||
if os.Args[1] == "sort" {
|
switch os.Args[1] {
|
||||||
|
case "s":
|
||||||
goto SORT
|
goto SORT
|
||||||
}
|
case "t":
|
||||||
if os.Args[1] == "temp" {
|
rime.Temp()
|
||||||
|
return
|
||||||
|
case "p":
|
||||||
|
rime.CheckPolyphone(rime.BasePath)
|
||||||
|
return
|
||||||
|
case "tp":
|
||||||
rime.Pinyin(filepath.Join(rime.RimeDir, "cn_dicts/temp"))
|
rime.Pinyin(filepath.Join(rime.RimeDir, "cn_dicts/temp"))
|
||||||
return
|
return
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
// 临时
|
|
||||||
rime.Temp()
|
|
||||||
|
|
||||||
// Emoji 检查和更新
|
// Emoji 检查和更新
|
||||||
rime.CheckAndGenerateEmoji()
|
rime.CheckAndGenerateEmoji()
|
||||||
fmt.Println("--------------------------------------------------")
|
fmt.Println("--------------------------------------------------")
|
||||||
|
@ -7,14 +7,17 @@ import (
|
|||||||
"os"
|
"os"
|
||||||
"strconv"
|
"strconv"
|
||||||
"strings"
|
"strings"
|
||||||
|
"unicode/utf8"
|
||||||
)
|
)
|
||||||
|
|
||||||
// 一些临时用的函数
|
// 一些临时用的函数
|
||||||
|
|
||||||
func Temp() {
|
func Temp() {
|
||||||
// defer os.Exit(11)
|
|
||||||
//
|
|
||||||
// GeneratePinyinTest("你的行动力")
|
// GeneratePinyinTest("你的行动力")
|
||||||
|
// GeneratePinyinTest("都挺长的")
|
||||||
|
// GeneratePinyinTest("血条长")
|
||||||
|
|
||||||
|
findP(BasePath, "谁")
|
||||||
}
|
}
|
||||||
|
|
||||||
// 列出字表中多音字的状况:是否参与自动注音
|
// 列出字表中多音字的状况:是否参与自动注音
|
||||||
@ -83,3 +86,55 @@ func polyphone() {
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
// 在字典中找到此行是否包含同义多音字,如果包含切长度大于等于3,从文件中删除这行,并将所有删除的行写入到 1.txt 中
|
||||||
|
func findP(dictPath string, ch string) {
|
||||||
|
// open file
|
||||||
|
file, err := os.OpenFile(dictPath, os.O_RDWR, 0666)
|
||||||
|
if err != nil {
|
||||||
|
log.Fatalln(err)
|
||||||
|
}
|
||||||
|
defer file.Close()
|
||||||
|
|
||||||
|
outFile, err := os.Create("1.txt")
|
||||||
|
if err != nil {
|
||||||
|
log.Fatalln(err)
|
||||||
|
}
|
||||||
|
defer outFile.Close()
|
||||||
|
|
||||||
|
lines := make([]string, 0)
|
||||||
|
|
||||||
|
isMark := false
|
||||||
|
sc := bufio.NewScanner(file)
|
||||||
|
for sc.Scan() {
|
||||||
|
line := sc.Text()
|
||||||
|
if !isMark {
|
||||||
|
lines = append(lines, line)
|
||||||
|
if line == mark {
|
||||||
|
isMark = true
|
||||||
|
}
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
if line == "" || strings.HasPrefix(line, "#") {
|
||||||
|
lines = append(lines, line)
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
parts := strings.Split(line, "\t")
|
||||||
|
if len(parts) != 3 {
|
||||||
|
log.Fatalln("len(parts) != 3", line)
|
||||||
|
}
|
||||||
|
text := parts[0]
|
||||||
|
if strings.Contains(text, ch) && utf8.RuneCountInString(text) >= 3 {
|
||||||
|
outFile.WriteString(line + "\n")
|
||||||
|
} else {
|
||||||
|
lines = append(lines, line)
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// 从 lines 重新写入 file
|
||||||
|
file.Truncate(0)
|
||||||
|
file.Seek(0, 0)
|
||||||
|
for _, line := range lines {
|
||||||
|
file.WriteString(line + "\n")
|
||||||
|
}
|
||||||
|
}
|
||||||
|
@ -44,8 +44,6 @@ var onlyOne = map[string]string{
|
|||||||
"私钥": "si yao",
|
"私钥": "si yao",
|
||||||
"甲壳": "jia ke",
|
"甲壳": "jia ke",
|
||||||
"掉色": "diao se",
|
"掉色": "diao se",
|
||||||
"变色": "bian se",
|
|
||||||
"上色": "shang se",
|
|
||||||
"怎么着": "zen me zhe",
|
"怎么着": "zen me zhe",
|
||||||
"这么着": "zhe me zhe",
|
"这么着": "zhe me zhe",
|
||||||
"那么着": "na me zhe",
|
"那么着": "na me zhe",
|
||||||
|
94
others/script/rime/polyphone.go
Normal file
94
others/script/rime/polyphone.go
Normal file
@ -0,0 +1,94 @@
|
|||||||
|
package rime
|
||||||
|
|
||||||
|
import (
|
||||||
|
"bufio"
|
||||||
|
"fmt"
|
||||||
|
"log"
|
||||||
|
"os"
|
||||||
|
"strings"
|
||||||
|
)
|
||||||
|
|
||||||
|
// 同义多音字
|
||||||
|
var polyphonicWords = []string{
|
||||||
|
"谁",
|
||||||
|
"血",
|
||||||
|
"熟",
|
||||||
|
"掴",
|
||||||
|
"爪",
|
||||||
|
"薄",
|
||||||
|
"剥",
|
||||||
|
"哟",
|
||||||
|
"嚼",
|
||||||
|
"忒", // te 不是,tui 和 tei 是
|
||||||
|
"密钥",
|
||||||
|
"公钥",
|
||||||
|
"私钥",
|
||||||
|
"甲壳",
|
||||||
|
"掉色",
|
||||||
|
}
|
||||||
|
|
||||||
|
// 不检查的词汇
|
||||||
|
var polyphonicWordsFilter = []string{
|
||||||
|
"咀嚼",
|
||||||
|
"薄暮", "薄地", "薄海", "薄酒", "薄礼", "薄面", "薄命", "薄情", "薄弱", "薄田", "薄物细故", "薄幸", "薄情", "薄葬", "厌薄", "厚积薄发", "履薄临深", "德薄望轻", "菲薄", "履薄", "孤军薄旅", "薄太后",
|
||||||
|
"剥离", "剥夺", "剥削", "剥落", "剥蚀", "剥啄",
|
||||||
|
"熟稔", "黄熟",
|
||||||
|
}
|
||||||
|
|
||||||
|
// CheckPolyphone 检查 base、ext 中同义多音字是否有两种读音
|
||||||
|
// 例如「谁的」应该同时存在 shei de 与 shui de 两种读音
|
||||||
|
func CheckPolyphone(dictPath string) {
|
||||||
|
file, err := os.Open(dictPath)
|
||||||
|
if err != nil {
|
||||||
|
log.Fatalln(err)
|
||||||
|
}
|
||||||
|
defer file.Close()
|
||||||
|
|
||||||
|
// 将含有同义多音字的词汇放入,key 为词汇,value 为注音
|
||||||
|
// 如果注音数组只有一个,则应该补充其他读音
|
||||||
|
m := make(map[string][]string)
|
||||||
|
|
||||||
|
isMark := false
|
||||||
|
sc := bufio.NewScanner(file)
|
||||||
|
for sc.Scan() {
|
||||||
|
line := sc.Text()
|
||||||
|
if !isMark {
|
||||||
|
if strings.HasPrefix(line, mark) {
|
||||||
|
isMark = true
|
||||||
|
}
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
if line == "" || strings.HasPrefix(line, "#") {
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
parts := strings.Split(line, "\t")
|
||||||
|
if len(parts) != 3 {
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
text, code := parts[0], parts[1]
|
||||||
|
if containsPolyphonicWordsFilter(text) {
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
for _, word := range polyphonicWords {
|
||||||
|
if strings.Contains(text, word) {
|
||||||
|
m[text] = append(m[text], code)
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// 遍历 m,输出单数读音的词汇
|
||||||
|
for text, codes := range m {
|
||||||
|
if len(codes)%2 != 0 {
|
||||||
|
fmt.Println(text)
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
func containsPolyphonicWordsFilter(text string) bool {
|
||||||
|
for _, filter := range polyphonicWordsFilter {
|
||||||
|
if strings.Contains(text, filter) {
|
||||||
|
return true
|
||||||
|
}
|
||||||
|
}
|
||||||
|
return false
|
||||||
|
}
|
@ -1,4 +1,18 @@
|
|||||||
# 在 # -_- 上面是错词;下面是包含错词但不是错词。
|
# 在 # -_- 上面是错词;下面是包含错词但不是错词。
|
||||||
|
元文件
|
||||||
|
桃花园
|
||||||
|
桃花缘
|
||||||
|
噌地
|
||||||
|
伶牙利
|
||||||
|
灵牙利
|
||||||
|
碧雪丹心
|
||||||
|
气嘘嘘
|
||||||
|
喘嘘嘘
|
||||||
|
长统袜
|
||||||
|
长统靴
|
||||||
|
铢铢较量
|
||||||
|
量角规
|
||||||
|
一天一炖
|
||||||
搏彩
|
搏彩
|
||||||
知书识理
|
知书识理
|
||||||
识理知书
|
识理知书
|
||||||
@ -1332,6 +1346,8 @@
|
|||||||
年青
|
年青
|
||||||
谐调
|
谐调
|
||||||
呆会
|
呆会
|
||||||
|
呆在
|
||||||
|
呆着
|
||||||
不惟
|
不惟
|
||||||
赢利
|
赢利
|
||||||
作主
|
作主
|
||||||
@ -3608,3 +3624,4 @@
|
|||||||
六西格玛项目
|
六西格玛项目
|
||||||
六西格玛黑带
|
六西格玛黑带
|
||||||
精益六西格玛
|
精益六西格玛
|
||||||
|
图元文件
|
||||||
|
Loading…
Reference in New Issue
Block a user