dict: 日常更新

This commit is contained in:
Dvel 2023-09-03 20:16:17 +08:00
parent 6a1c50649f
commit bd2b6ba021
14 changed files with 2714 additions and 1114 deletions

View File

@ -33,7 +33,7 @@
# 需要注音的字词设定在 others/script/rime/需要注音.txt # 需要注音的字词设定在 others/script/rime/需要注音.txt
--- ---
name: 8105 name: 8105
version: "2023-08-27" version: "2023-09-03"
sort: by_weight sort: by_weight
... ...
### 按需启用 ### 按需启用
@ -3327,6 +3327,7 @@ sort: by_weight
柯 ke 71973 柯 ke 71973
棵 ke 58780 棵 ke 58780
壳 ke 41877 壳 ke 41877
氪 ke 35000
磕 ke 34654 磕 ke 34654
嗑 ke 31720 嗑 ke 31720
珂 ke 16769 珂 ke 16769
@ -3346,7 +3347,6 @@ sort: by_weight
髁 ke 232 髁 ke 232
骒 ke 91 骒 ke 91
缂 ke 79 缂 ke 79
氪 ke 30
牁 ke 14 牁 ke 14
匼 ke 3 匼 ke 3
炣 ke 0 炣 ke 0
@ -8194,6 +8194,7 @@ sort: by_weight
至 zhi 1199059 至 zhi 1199059
之 zhi 1173763 之 zhi 1173763
指 zhi 1099010 指 zhi 1099010
值 zhi 920306
制 zhi 870792 制 zhi 870792
支 zhi 532396 支 zhi 532396
志 zhi 485065 志 zhi 485065
@ -8203,7 +8204,6 @@ sort: by_weight
置 zhi 379704 置 zhi 379704
致 zhi 370734 致 zhi 370734
职 zhi 326699 职 zhi 326699
值 zhi 320306
智 zhi 310406 智 zhi 310406
纸 zhi 273013 纸 zhi 273013
织 zhi 218959 织 zhi 218959

File diff suppressed because it is too large Load Diff

File diff suppressed because it is too large Load Diff

View File

@ -8,7 +8,7 @@
# #
--- ---
name: others name: others
version: "2023-08-15" version: "2023-09-03"
sort: by_weight sort: by_weight
... ...
##### 容错词 ##### 容错词
@ -142,6 +142,8 @@ sort: by_weight
太行山 tai xing shan 太行山 tai xing shan
歇斯底里 xie si di li 歇斯底里 xie si di li
歇斯底里 jie si di li 歇斯底里 jie si di li
暖和 nuan huo
暖和 nuan he
### 错字 ### 错字
曾经 ceng jing 曾经 ceng jing
曾今 ceng jin 曾今 ceng jin

File diff suppressed because it is too large Load Diff

View File

@ -7,7 +7,7 @@
# #
--- ---
name: en_ext name: en_ext
version: "2023-08-27" version: "2023-09-03"
sort: by_weight sort: by_weight
... ...
# 一些杂项 # 一些杂项
@ -1644,9 +1644,7 @@ Windows Windows
Microsoft Microsoft Microsoft Microsoft
Nintendo Nintendo Nintendo Nintendo
Google Google Google Google
Nexus Nexus
nexus nexus nexus nexus
Pixel Pixel
Wii U WiiU Wii U WiiU
Wii Wii Wii Wii
Oracle Oracle Oracle Oracle
@ -2262,3 +2260,6 @@ C# C#
C# Csharp C# Csharp
C# Cjing C# Cjing
decode decode decode decode
KeyCastr KeyCastr
Laugh Tale LaughTale
Joy Boy JoyBoy

View File

@ -71,6 +71,7 @@ local corrections = {
["tiao huan"] = { text = "调换", comment = "diao huan" }, ["tiao huan"] = { text = "调换", comment = "diao huan" },
["tai xing shan"] = { text = "太行山", comment = "tai hang shan" }, ["tai xing shan"] = { text = "太行山", comment = "tai hang shan" },
["jie si di li"] = { text = "歇斯底里", comment = "xie si di li" }, ["jie si di li"] = { text = "歇斯底里", comment = "xie si di li" },
["nuan he"] = { text = "暖和", comment = "nuan huo" },
-- 错字 -- 错字
["ceng jin"] = { text = "曾今", comment = "曾经" }, ["ceng jin"] = { text = "曾今", comment = "曾经" },
["an nai"] = { text = "按耐", comment = "按捺(na)" }, ["an nai"] = { text = "按耐", comment = "按捺(na)" },

View File

@ -210,8 +210,10 @@ respect respect 🫡
忧虑 忧虑 😔 忧虑 忧虑 😔
忧伤 忧伤 😔 忧伤 忧伤 😔
困 困 😪 🥱 困 困 😪 🥱
困困 困困 😪
困了 困了 😪 🥱 困了 困了 😪 🥱
困倦 困倦 😪 🥱 困倦 困倦 😪 🥱
困乏 困乏 😪
瞌睡 瞌睡 😪 瞌睡 瞌睡 😪
打瞌睡 打瞌睡 😪 打瞌睡 打瞌睡 😪
口水 口水 🤤 口水 口水 🤤
@ -509,6 +511,8 @@ angry angry 😡 😠 💢
送你一颗心 送你一颗心 💝 送你一颗心 送你一颗心 💝
闪亮的心 闪亮的心 💖 闪亮的心 闪亮的心 💖
爱心 爱心 💖 ♥️ 爱心 爱心 💖 ♥️
感谢 感谢 💖 🙏
谢谢 谢谢 💖 🙏
膨胀的心 膨胀的心 💗 膨胀的心 膨胀的心 💗
膨胀的爱心 膨胀的爱心 💗 膨胀的爱心 膨胀的爱心 💗
搏动的心 搏动的心 💗 搏动的心 搏动的心 💗
@ -816,7 +820,6 @@ OK OK 👌 🙆‍♂️ 🙆‍♀️ 🆗
拜托 拜托 🙏 拜托 拜托 🙏
祈求 祈求 🙏 祈求 祈求 🙏
祈祷 祈祷 🙏 祈祷 祈祷 🙏
谢谢 谢谢 🙏
超度 超度 🙏 超度 超度 🙏
阿弥陀佛 阿弥陀佛 🙏 阿弥陀佛 阿弥陀佛 🙏
写字 写字 ✍️ 写字 写字 ✍️
@ -2045,6 +2048,9 @@ bug bug 🐛
鱼饼 鱼饼 🍥 鱼饼 鱼饼 🍥
鱼板 鱼板 🍥 鱼板 鱼板 🍥
月饼 月饼 🥮 月饼 月饼 🥮
月团 月团 🥮
丰收饼 丰收饼 🥮
团圆饼 团圆饼 🥮
团子 团子 🍡 团子 团子 🍡
糯米团 糯米团 🍡 糯米团 糯米团 🍡
饺子 饺子 🥟 饺子 饺子 🥟
@ -2096,6 +2102,8 @@ cookies cookies 🍪
朱古力 朱古力 🍫 朱古力 朱古力 🍫
朱古力棒 朱古力棒 🍫 朱古力棒 朱古力棒 🍫
糖果 糖果 🍬 糖果 糖果 🍬
糖 糖 🍬
吃糖 吃糖 🍬
棒棒糖 棒棒糖 🍭 棒棒糖 棒棒糖 🍭
蛋奶糕 蛋奶糕 🍮 蛋奶糕 蛋奶糕 🍮
甜品 甜品 🍮 甜品 甜品 🍮
@ -2104,14 +2112,17 @@ cookies cookies 🍪
蜜罐 蜜罐 🍯 蜜罐 蜜罐 🍯
蜂蜜 蜂蜜 🍯 蜂蜜 蜂蜜 🍯
奶瓶 奶瓶 🍼 奶瓶 奶瓶 🍼
喝奶 喝奶 🍼
一杯奶 一杯奶 🥛 一杯奶 一杯奶 🥛
牛奶杯 牛奶杯 🥛 牛奶杯 牛奶杯 🥛
牛奶 牛奶 🥛 牛奶 牛奶 🥛
杯子 杯子 🥛 杯子 杯子 🥛
玻璃杯 玻璃杯 🥛
咖啡 咖啡 ☕ 咖啡 咖啡 ☕
咖啡杯 咖啡杯 ☕ 咖啡杯 咖啡杯 ☕
喝咖啡 喝咖啡 ☕
茶壶 茶壶 🫖 茶壶 茶壶 🫖
一壶茶 一壶茶 🫖
一壶 一壶 🫖
茶 茶 🍵 茶 茶 🍵
茶水 茶水 🍵 茶水 茶水 🍵
茶杯 茶杯 🍵 茶杯 茶杯 🍵
@ -2126,11 +2137,15 @@ cookies cookies 🍪
热带水果饮料 热带水果饮料 🍹 热带水果饮料 热带水果饮料 🍹
水果饮料 水果饮料 🍹 水果饮料 水果饮料 🍹
果饮 果饮 🍹 果饮 果饮 🍹
冷饮 冷饮 🍹
啤酒 啤酒 🍺 啤酒 啤酒 🍺
干杯 干杯 🍻 🥂 干杯 干杯 🍻 🥂
碰杯 碰杯 🍻 🥂 碰杯 碰杯 🍻 🥂
威士忌 威士忌 🥃 威士忌 威士忌 🥃
平底杯 平底杯 🥃 平底杯 平底杯 🥃
一杯酒 一杯酒 🥃
一杯 一杯 🥃
玻璃杯 玻璃杯 🥃
倾倒液体 倾倒液体 🫗 倾倒液体 倾倒液体 🫗
倾倒 倾倒 🫗 倾倒 倾倒 🫗
流出 流出 🫗 流出 流出 🫗
@ -2981,6 +2996,7 @@ T恤衫 T恤衫 👕
钻戒 钻戒 💍 钻戒 钻戒 💍
求婚戒 求婚戒 💍 求婚戒 求婚戒 💍
订婚戒 订婚戒 💍 订婚戒 订婚戒 💍
星钻 星钻 💍
宝石 宝石 💎 宝石 宝石 💎
钻石 钻石 💎 钻石 钻石 💎
已静音的扬声器 已静音的扬声器 🔇 已静音的扬声器 已静音的扬声器 🔇

View File

@ -1,7 +1,7 @@
# Emoji 映射表 # Emoji 映射表
# 根据此文件生成 emoji.txt # 根据此文件生成 emoji.txt
# #
# version: 2023-08-27 # version: 2023-09-03
# #
# 中文映射由 Dvel 纯手工打造 https://github.com/iDvel/rime-ice # 中文映射由 Dvel 纯手工打造 https://github.com/iDvel/rime-ice
# #
@ -86,7 +86,7 @@ S$ 新加坡元 新加坡币
# face-sleepy # face-sleepy
😌 如释重负 松了口气 松口气 释然 😌 如释重负 松了口气 松口气 释然
😔 低头忧伤 心事重重 忧虑 忧伤 😔 低头忧伤 心事重重 忧虑 忧伤
😪 困 困了 困倦 瞌睡 打瞌睡 😪 困 困困 困了 困倦 困乏 瞌睡 打瞌睡
🤤 口水 流口水 垂涎三尺 🤤 口水 流口水 垂涎三尺
😴 睡觉 睡着 睡着了 睡了 睡眠 😴 睡觉 睡着 睡着了 睡了 睡眠
# face-unwell # face-unwell
@ -173,7 +173,7 @@ S$ 新加坡元 新加坡币
💌 情书 💌 情书
💘 一箭穿心 丘比特 心中箭了 💘 一箭穿心 丘比特 心中箭了
💝 爱的礼物 系有缎带的心 饰以丝带的心 送你一颗心 💝 爱的礼物 系有缎带的心 饰以丝带的心 送你一颗心
💖 闪亮的心 爱心 💖 闪亮的心 爱心 感谢 谢谢
💗 膨胀的心 膨胀的爱心 搏动的心 💗 膨胀的心 膨胀的爱心 搏动的心
💓 心动 心跳 爱情 love 💓 心动 心跳 爱情 love
💞 旋转的心 舞动的心 心连心 💞 旋转的心 舞动的心 心连心
@ -254,7 +254,7 @@ S$ 新加坡元 新加坡币
👐 双手张开 张开双手 👐 双手张开 张开双手
🤲 双手手掌向上 掌心向上托起 双手 捧着 🤲 双手手掌向上 掌心向上托起 双手 捧着
🤝 握手 合作 合作愉快 搞定 🤝 握手 合作 合作愉快 搞定
🙏 双手合十 合十 合掌 拜托 祈求 祈祷 求你了 求求你 求求你了 谢谢 超度 阿弥陀佛 🙏 双手合十 合十 合掌 拜托 祈求 祈祷 求你了 求求你 求求你了 感谢 谢谢 超度 阿弥陀佛
# hand-prop # hand-prop
✍️ 写字 手写 ✍️ 写字 手写
💅 指甲油 涂指甲油 美甲 做指甲 做美甲 💅 指甲油 涂指甲油 美甲 做指甲 做美甲
@ -847,7 +847,7 @@ S$ 新加坡元 新加坡币
🍣 寿司 🍣 寿司
🍤 炸虾 天妇罗 🍤 炸虾 天妇罗
🍥 盘绕是炸鱼饼 鱼饼 鱼板 🍥 盘绕是炸鱼饼 鱼饼 鱼板
🥮 月饼 🥮 月饼 月团 丰收饼 团圆饼
🍡 团子 糯米团 🍡 团子 糯米团
🥟 饺子 水饺 🥟 饺子 水饺
🥠 幸运饼干 🥠 幸运饼干
@ -869,25 +869,25 @@ S$ 新加坡元 新加坡币
🧁 纸杯蛋糕 🧁 纸杯蛋糕
🥧 派 油酥点心 点心 🥧 派 油酥点心 点心
🍫 巧克力 巧克力棒 朱古力 朱古力棒 🍫 巧克力 巧克力棒 朱古力 朱古力棒
🍬 糖果 🍬 糖果 糖 吃糖
🍭 棒棒糖 🍭 棒棒糖
🍮 蛋奶糕 甜品 甜点 布丁 🍮 蛋奶糕 甜品 甜点 布丁
🍯 蜜罐 蜂蜜 🍯 蜜罐 蜂蜜
# drink # drink
🍼 奶瓶 🍼 奶瓶 喝奶
🥛 一杯奶 牛奶杯 牛奶 杯子 玻璃杯 🥛 一杯奶 牛奶杯 牛奶 杯子
☕ 咖啡 咖啡杯 ☕ 咖啡 咖啡杯 喝咖啡
🫖 茶壶 🫖 茶壶 一壶茶 一壶
🍵 茶 茶水 茶杯 🍵 茶 茶水 茶杯
🍶 清酒 🍶 清酒
🍾 开香槟 香槟 🍾 开香槟 香槟
🍷 葡萄酒 酒杯 酒 🍷 葡萄酒 酒杯 酒
🍸 鸡尾酒 🍸 鸡尾酒
🍹 热带饮料 热带水果饮料 水果饮料 果饮 🍹 热带饮料 热带水果饮料 水果饮料 果饮 冷饮
🍺 啤酒 🍺 啤酒
🍻 干杯 碰杯 🍻 干杯 碰杯
🥂 干杯 碰杯 🥂 干杯 碰杯
🥃 威士忌 平底杯 🥃 威士忌 平底杯 一杯酒 一杯 玻璃杯
🫗 倾倒液体 倾倒 流出 🫗 倾倒液体 倾倒 流出
🥤 外带杯子 带吸管杯 吸管杯 饮料 🥤 外带杯子 带吸管杯 吸管杯 饮料
🧋 波霸奶茶 珍珠奶茶 奶茶 一杯奶茶 🧋 波霸奶茶 珍珠奶茶 奶茶 一杯奶茶
@ -1269,7 +1269,7 @@ S$ 新加坡元 新加坡币
⛑️ 安全帽 白十字头盔 白十字安全帽 十字安全帽 十字头盔 ⛑️ 安全帽 白十字头盔 白十字安全帽 十字安全帽 十字头盔
📿 念珠 📿 念珠
💄 口红 唇膏 💄 口红 唇膏
💍 戒指 钻戒 求婚戒 订婚戒 💍 戒指 钻戒 求婚戒 订婚戒 星钻
💎 宝石 钻石 💎 宝石 钻石
# sound # sound
🔇 已静音的扬声器 扬声器关闭 静音 🔇 已静音的扬声器 扬声器关闭 静音

View File

@ -11,19 +11,23 @@ import (
func main() { func main() {
log.SetFlags(log.LstdFlags | log.Lshortfile) log.SetFlags(log.LstdFlags | log.Lshortfile)
if len(os.Args) > 1 { if len(os.Args) > 1 {
if os.Args[1] == "sort" { switch os.Args[1] {
case "s":
goto SORT goto SORT
} case "t":
if os.Args[1] == "temp" { rime.Temp()
return
case "p":
rime.CheckPolyphone(rime.BasePath)
return
case "tp":
rime.Pinyin(filepath.Join(rime.RimeDir, "cn_dicts/temp")) rime.Pinyin(filepath.Join(rime.RimeDir, "cn_dicts/temp"))
return return
} }
} }
// 临时
rime.Temp()
// Emoji 检查和更新 // Emoji 检查和更新
rime.CheckAndGenerateEmoji() rime.CheckAndGenerateEmoji()
fmt.Println("--------------------------------------------------") fmt.Println("--------------------------------------------------")

View File

@ -7,14 +7,17 @@ import (
"os" "os"
"strconv" "strconv"
"strings" "strings"
"unicode/utf8"
) )
// 一些临时用的函数 // 一些临时用的函数
func Temp() { func Temp() {
// defer os.Exit(11)
//
// GeneratePinyinTest("你的行动力") // GeneratePinyinTest("你的行动力")
// GeneratePinyinTest("都挺长的")
// GeneratePinyinTest("血条长")
findP(BasePath, "谁")
} }
// 列出字表中多音字的状况:是否参与自动注音 // 列出字表中多音字的状况:是否参与自动注音
@ -83,3 +86,55 @@ func polyphone() {
} }
} }
} }
// 在字典中找到此行是否包含同义多音字如果包含切长度大于等于3从文件中删除这行并将所有删除的行写入到 1.txt 中
func findP(dictPath string, ch string) {
// open file
file, err := os.OpenFile(dictPath, os.O_RDWR, 0666)
if err != nil {
log.Fatalln(err)
}
defer file.Close()
outFile, err := os.Create("1.txt")
if err != nil {
log.Fatalln(err)
}
defer outFile.Close()
lines := make([]string, 0)
isMark := false
sc := bufio.NewScanner(file)
for sc.Scan() {
line := sc.Text()
if !isMark {
lines = append(lines, line)
if line == mark {
isMark = true
}
continue
}
if line == "" || strings.HasPrefix(line, "#") {
lines = append(lines, line)
continue
}
parts := strings.Split(line, "\t")
if len(parts) != 3 {
log.Fatalln("len(parts) != 3", line)
}
text := parts[0]
if strings.Contains(text, ch) && utf8.RuneCountInString(text) >= 3 {
outFile.WriteString(line + "\n")
} else {
lines = append(lines, line)
}
}
// 从 lines 重新写入 file
file.Truncate(0)
file.Seek(0, 0)
for _, line := range lines {
file.WriteString(line + "\n")
}
}

View File

@ -44,8 +44,6 @@ var onlyOne = map[string]string{
"私钥": "si yao", "私钥": "si yao",
"甲壳": "jia ke", "甲壳": "jia ke",
"掉色": "diao se", "掉色": "diao se",
"变色": "bian se",
"上色": "shang se",
"怎么着": "zen me zhe", "怎么着": "zen me zhe",
"这么着": "zhe me zhe", "这么着": "zhe me zhe",
"那么着": "na me zhe", "那么着": "na me zhe",

View File

@ -0,0 +1,94 @@
package rime
import (
"bufio"
"fmt"
"log"
"os"
"strings"
)
// 同义多音字
var polyphonicWords = []string{
"谁",
"血",
"熟",
"掴",
"爪",
"薄",
"剥",
"哟",
"嚼",
"忒", // te 不是tui 和 tei 是
"密钥",
"公钥",
"私钥",
"甲壳",
"掉色",
}
// 不检查的词汇
var polyphonicWordsFilter = []string{
"咀嚼",
"薄暮", "薄地", "薄海", "薄酒", "薄礼", "薄面", "薄命", "薄情", "薄弱", "薄田", "薄物细故", "薄幸", "薄情", "薄葬", "厌薄", "厚积薄发", "履薄临深", "德薄望轻", "菲薄", "履薄", "孤军薄旅", "薄太后",
"剥离", "剥夺", "剥削", "剥落", "剥蚀", "剥啄",
"熟稔", "黄熟",
}
// CheckPolyphone 检查 base、ext 中同义多音字是否有两种读音
// 例如「谁的」应该同时存在 shei de 与 shui de 两种读音
func CheckPolyphone(dictPath string) {
file, err := os.Open(dictPath)
if err != nil {
log.Fatalln(err)
}
defer file.Close()
// 将含有同义多音字的词汇放入key 为词汇value 为注音
// 如果注音数组只有一个,则应该补充其他读音
m := make(map[string][]string)
isMark := false
sc := bufio.NewScanner(file)
for sc.Scan() {
line := sc.Text()
if !isMark {
if strings.HasPrefix(line, mark) {
isMark = true
}
continue
}
if line == "" || strings.HasPrefix(line, "#") {
continue
}
parts := strings.Split(line, "\t")
if len(parts) != 3 {
continue
}
text, code := parts[0], parts[1]
if containsPolyphonicWordsFilter(text) {
continue
}
for _, word := range polyphonicWords {
if strings.Contains(text, word) {
m[text] = append(m[text], code)
}
}
}
// 遍历 m输出单数读音的词汇
for text, codes := range m {
if len(codes)%2 != 0 {
fmt.Println(text)
}
}
}
func containsPolyphonicWordsFilter(text string) bool {
for _, filter := range polyphonicWordsFilter {
if strings.Contains(text, filter) {
return true
}
}
return false
}

View File

@ -1,4 +1,18 @@
# 在 # -_- 上面是错词;下面是包含错词但不是错词。 # 在 # -_- 上面是错词;下面是包含错词但不是错词。
元文件
桃花园
桃花缘
噌地
伶牙利
灵牙利
碧雪丹心
气嘘嘘
喘嘘嘘
长统袜
长统靴
铢铢较量
量角规
一天一炖
搏彩 搏彩
知书识理 知书识理
识理知书 识理知书
@ -1332,6 +1346,8 @@
年青 年青
谐调 谐调
呆会 呆会
呆在
呆着
不惟 不惟
赢利 赢利
作主 作主
@ -3608,3 +3624,4 @@
六西格玛项目 六西格玛项目
六西格玛黑带 六西格玛黑带
精益六西格玛 精益六西格玛
图元文件