dict: 日常更新

This commit is contained in:
Dvel 2023-09-03 20:16:17 +08:00
parent 6a1c50649f
commit bd2b6ba021
14 changed files with 2714 additions and 1114 deletions

View File

@ -33,7 +33,7 @@
# 需要注音的字词设定在 others/script/rime/需要注音.txt
---
name: 8105
version: "2023-08-27"
version: "2023-09-03"
sort: by_weight
...
### 按需启用
@ -3327,6 +3327,7 @@ sort: by_weight
柯 ke 71973
棵 ke 58780
壳 ke 41877
氪 ke 35000
磕 ke 34654
嗑 ke 31720
珂 ke 16769
@ -3346,7 +3347,6 @@ sort: by_weight
髁 ke 232
骒 ke 91
缂 ke 79
氪 ke 30
牁 ke 14
匼 ke 3
炣 ke 0
@ -8194,6 +8194,7 @@ sort: by_weight
至 zhi 1199059
之 zhi 1173763
指 zhi 1099010
值 zhi 920306
制 zhi 870792
支 zhi 532396
志 zhi 485065
@ -8203,7 +8204,6 @@ sort: by_weight
置 zhi 379704
致 zhi 370734
职 zhi 326699
值 zhi 320306
智 zhi 310406
纸 zhi 273013
织 zhi 218959

File diff suppressed because it is too large Load Diff

File diff suppressed because it is too large Load Diff

View File

@ -8,7 +8,7 @@
#
---
name: others
version: "2023-08-15"
version: "2023-09-03"
sort: by_weight
...
##### 容错词
@ -142,6 +142,8 @@ sort: by_weight
太行山 tai xing shan
歇斯底里 xie si di li
歇斯底里 jie si di li
暖和 nuan huo
暖和 nuan he
### 错字
曾经 ceng jing
曾今 ceng jin

File diff suppressed because it is too large Load Diff

View File

@ -7,7 +7,7 @@
#
---
name: en_ext
version: "2023-08-27"
version: "2023-09-03"
sort: by_weight
...
# 一些杂项
@ -1644,9 +1644,7 @@ Windows Windows
Microsoft Microsoft
Nintendo Nintendo
Google Google
Nexus Nexus
nexus nexus
Pixel Pixel
Wii U WiiU
Wii Wii
Oracle Oracle
@ -2262,3 +2260,6 @@ C# C#
C# Csharp
C# Cjing
decode decode
KeyCastr KeyCastr
Laugh Tale LaughTale
Joy Boy JoyBoy

View File

@ -71,6 +71,7 @@ local corrections = {
["tiao huan"] = { text = "调换", comment = "diao huan" },
["tai xing shan"] = { text = "太行山", comment = "tai hang shan" },
["jie si di li"] = { text = "歇斯底里", comment = "xie si di li" },
["nuan he"] = { text = "暖和", comment = "nuan huo" },
-- 错字
["ceng jin"] = { text = "曾今", comment = "曾经" },
["an nai"] = { text = "按耐", comment = "按捺(na)" },

View File

@ -210,8 +210,10 @@ respect respect 🫡
忧虑 忧虑 😔
忧伤 忧伤 😔
困 困 😪 🥱
困困 困困 😪
困了 困了 😪 🥱
困倦 困倦 😪 🥱
困乏 困乏 😪
瞌睡 瞌睡 😪
打瞌睡 打瞌睡 😪
口水 口水 🤤
@ -509,6 +511,8 @@ angry angry 😡 😠 💢
送你一颗心 送你一颗心 💝
闪亮的心 闪亮的心 💖
爱心 爱心 💖 ♥️
感谢 感谢 💖 🙏
谢谢 谢谢 💖 🙏
膨胀的心 膨胀的心 💗
膨胀的爱心 膨胀的爱心 💗
搏动的心 搏动的心 💗
@ -816,7 +820,6 @@ OK OK 👌 🙆‍♂️ 🙆‍♀️ 🆗
拜托 拜托 🙏
祈求 祈求 🙏
祈祷 祈祷 🙏
谢谢 谢谢 🙏
超度 超度 🙏
阿弥陀佛 阿弥陀佛 🙏
写字 写字 ✍️
@ -2045,6 +2048,9 @@ bug bug 🐛
鱼饼 鱼饼 🍥
鱼板 鱼板 🍥
月饼 月饼 🥮
月团 月团 🥮
丰收饼 丰收饼 🥮
团圆饼 团圆饼 🥮
团子 团子 🍡
糯米团 糯米团 🍡
饺子 饺子 🥟
@ -2096,6 +2102,8 @@ cookies cookies 🍪
朱古力 朱古力 🍫
朱古力棒 朱古力棒 🍫
糖果 糖果 🍬
糖 糖 🍬
吃糖 吃糖 🍬
棒棒糖 棒棒糖 🍭
蛋奶糕 蛋奶糕 🍮
甜品 甜品 🍮
@ -2104,14 +2112,17 @@ cookies cookies 🍪
蜜罐 蜜罐 🍯
蜂蜜 蜂蜜 🍯
奶瓶 奶瓶 🍼
喝奶 喝奶 🍼
一杯奶 一杯奶 🥛
牛奶杯 牛奶杯 🥛
牛奶 牛奶 🥛
杯子 杯子 🥛
玻璃杯 玻璃杯 🥛
咖啡 咖啡 ☕
咖啡杯 咖啡杯 ☕
喝咖啡 喝咖啡 ☕
茶壶 茶壶 🫖
一壶茶 一壶茶 🫖
一壶 一壶 🫖
茶 茶 🍵
茶水 茶水 🍵
茶杯 茶杯 🍵
@ -2126,11 +2137,15 @@ cookies cookies 🍪
热带水果饮料 热带水果饮料 🍹
水果饮料 水果饮料 🍹
果饮 果饮 🍹
冷饮 冷饮 🍹
啤酒 啤酒 🍺
干杯 干杯 🍻 🥂
碰杯 碰杯 🍻 🥂
威士忌 威士忌 🥃
平底杯 平底杯 🥃
一杯酒 一杯酒 🥃
一杯 一杯 🥃
玻璃杯 玻璃杯 🥃
倾倒液体 倾倒液体 🫗
倾倒 倾倒 🫗
流出 流出 🫗
@ -2981,6 +2996,7 @@ T恤衫 T恤衫 👕
钻戒 钻戒 💍
求婚戒 求婚戒 💍
订婚戒 订婚戒 💍
星钻 星钻 💍
宝石 宝石 💎
钻石 钻石 💎
已静音的扬声器 已静音的扬声器 🔇

View File

@ -1,7 +1,7 @@
# Emoji 映射表
# 根据此文件生成 emoji.txt
#
# version: 2023-08-27
# version: 2023-09-03
#
# 中文映射由 Dvel 纯手工打造 https://github.com/iDvel/rime-ice
#
@ -86,7 +86,7 @@ S$ 新加坡元 新加坡币
# face-sleepy
😌 如释重负 松了口气 松口气 释然
😔 低头忧伤 心事重重 忧虑 忧伤
😪 困 困了 困倦 瞌睡 打瞌睡
😪 困 困困 困了 困倦 困乏 瞌睡 打瞌睡
🤤 口水 流口水 垂涎三尺
😴 睡觉 睡着 睡着了 睡了 睡眠
# face-unwell
@ -173,7 +173,7 @@ S$ 新加坡元 新加坡币
💌 情书
💘 一箭穿心 丘比特 心中箭了
💝 爱的礼物 系有缎带的心 饰以丝带的心 送你一颗心
💖 闪亮的心 爱心
💖 闪亮的心 爱心 感谢 谢谢
💗 膨胀的心 膨胀的爱心 搏动的心
💓 心动 心跳 爱情 love
💞 旋转的心 舞动的心 心连心
@ -254,7 +254,7 @@ S$ 新加坡元 新加坡币
👐 双手张开 张开双手
🤲 双手手掌向上 掌心向上托起 双手 捧着
🤝 握手 合作 合作愉快 搞定
🙏 双手合十 合十 合掌 拜托 祈求 祈祷 求你了 求求你 求求你了 谢谢 超度 阿弥陀佛
🙏 双手合十 合十 合掌 拜托 祈求 祈祷 求你了 求求你 求求你了 感谢 谢谢 超度 阿弥陀佛
# hand-prop
✍️ 写字 手写
💅 指甲油 涂指甲油 美甲 做指甲 做美甲
@ -847,7 +847,7 @@ S$ 新加坡元 新加坡币
🍣 寿司
🍤 炸虾 天妇罗
🍥 盘绕是炸鱼饼 鱼饼 鱼板
🥮 月饼
🥮 月饼 月团 丰收饼 团圆饼
🍡 团子 糯米团
🥟 饺子 水饺
🥠 幸运饼干
@ -869,25 +869,25 @@ S$ 新加坡元 新加坡币
🧁 纸杯蛋糕
🥧 派 油酥点心 点心
🍫 巧克力 巧克力棒 朱古力 朱古力棒
🍬 糖果
🍬 糖果 糖 吃糖
🍭 棒棒糖
🍮 蛋奶糕 甜品 甜点 布丁
🍯 蜜罐 蜂蜜
# drink
🍼 奶瓶
🥛 一杯奶 牛奶杯 牛奶 杯子 玻璃杯
☕ 咖啡 咖啡杯
🫖 茶壶
🍼 奶瓶 喝奶
🥛 一杯奶 牛奶杯 牛奶 杯子
☕ 咖啡 咖啡杯 喝咖啡
🫖 茶壶 一壶茶 一壶
🍵 茶 茶水 茶杯
🍶 清酒
🍾 开香槟 香槟
🍷 葡萄酒 酒杯 酒
🍸 鸡尾酒
🍹 热带饮料 热带水果饮料 水果饮料 果饮
🍹 热带饮料 热带水果饮料 水果饮料 果饮 冷饮
🍺 啤酒
🍻 干杯 碰杯
🥂 干杯 碰杯
🥃 威士忌 平底杯
🥃 威士忌 平底杯 一杯酒 一杯 玻璃杯
🫗 倾倒液体 倾倒 流出
🥤 外带杯子 带吸管杯 吸管杯 饮料
🧋 波霸奶茶 珍珠奶茶 奶茶 一杯奶茶
@ -1269,7 +1269,7 @@ S$ 新加坡元 新加坡币
⛑️ 安全帽 白十字头盔 白十字安全帽 十字安全帽 十字头盔
📿 念珠
💄 口红 唇膏
💍 戒指 钻戒 求婚戒 订婚戒
💍 戒指 钻戒 求婚戒 订婚戒 星钻
💎 宝石 钻石
# sound
🔇 已静音的扬声器 扬声器关闭 静音

View File

@ -11,19 +11,23 @@ import (
func main() {
log.SetFlags(log.LstdFlags | log.Lshortfile)
if len(os.Args) > 1 {
if os.Args[1] == "sort" {
switch os.Args[1] {
case "s":
goto SORT
}
if os.Args[1] == "temp" {
case "t":
rime.Temp()
return
case "p":
rime.CheckPolyphone(rime.BasePath)
return
case "tp":
rime.Pinyin(filepath.Join(rime.RimeDir, "cn_dicts/temp"))
return
}
}
// 临时
rime.Temp()
// Emoji 检查和更新
rime.CheckAndGenerateEmoji()
fmt.Println("--------------------------------------------------")

View File

@ -7,14 +7,17 @@ import (
"os"
"strconv"
"strings"
"unicode/utf8"
)
// 一些临时用的函数
func Temp() {
// defer os.Exit(11)
//
// GeneratePinyinTest("你的行动力")
// GeneratePinyinTest("都挺长的")
// GeneratePinyinTest("血条长")
findP(BasePath, "谁")
}
// 列出字表中多音字的状况:是否参与自动注音
@ -83,3 +86,55 @@ func polyphone() {
}
}
}
// 在字典中找到此行是否包含同义多音字如果包含切长度大于等于3从文件中删除这行并将所有删除的行写入到 1.txt 中
func findP(dictPath string, ch string) {
// open file
file, err := os.OpenFile(dictPath, os.O_RDWR, 0666)
if err != nil {
log.Fatalln(err)
}
defer file.Close()
outFile, err := os.Create("1.txt")
if err != nil {
log.Fatalln(err)
}
defer outFile.Close()
lines := make([]string, 0)
isMark := false
sc := bufio.NewScanner(file)
for sc.Scan() {
line := sc.Text()
if !isMark {
lines = append(lines, line)
if line == mark {
isMark = true
}
continue
}
if line == "" || strings.HasPrefix(line, "#") {
lines = append(lines, line)
continue
}
parts := strings.Split(line, "\t")
if len(parts) != 3 {
log.Fatalln("len(parts) != 3", line)
}
text := parts[0]
if strings.Contains(text, ch) && utf8.RuneCountInString(text) >= 3 {
outFile.WriteString(line + "\n")
} else {
lines = append(lines, line)
}
}
// 从 lines 重新写入 file
file.Truncate(0)
file.Seek(0, 0)
for _, line := range lines {
file.WriteString(line + "\n")
}
}

View File

@ -44,8 +44,6 @@ var onlyOne = map[string]string{
"私钥": "si yao",
"甲壳": "jia ke",
"掉色": "diao se",
"变色": "bian se",
"上色": "shang se",
"怎么着": "zen me zhe",
"这么着": "zhe me zhe",
"那么着": "na me zhe",

View File

@ -0,0 +1,94 @@
package rime
import (
"bufio"
"fmt"
"log"
"os"
"strings"
)
// 同义多音字
var polyphonicWords = []string{
"谁",
"血",
"熟",
"掴",
"爪",
"薄",
"剥",
"哟",
"嚼",
"忒", // te 不是tui 和 tei 是
"密钥",
"公钥",
"私钥",
"甲壳",
"掉色",
}
// 不检查的词汇
var polyphonicWordsFilter = []string{
"咀嚼",
"薄暮", "薄地", "薄海", "薄酒", "薄礼", "薄面", "薄命", "薄情", "薄弱", "薄田", "薄物细故", "薄幸", "薄情", "薄葬", "厌薄", "厚积薄发", "履薄临深", "德薄望轻", "菲薄", "履薄", "孤军薄旅", "薄太后",
"剥离", "剥夺", "剥削", "剥落", "剥蚀", "剥啄",
"熟稔", "黄熟",
}
// CheckPolyphone 检查 base、ext 中同义多音字是否有两种读音
// 例如「谁的」应该同时存在 shei de 与 shui de 两种读音
func CheckPolyphone(dictPath string) {
file, err := os.Open(dictPath)
if err != nil {
log.Fatalln(err)
}
defer file.Close()
// 将含有同义多音字的词汇放入key 为词汇value 为注音
// 如果注音数组只有一个,则应该补充其他读音
m := make(map[string][]string)
isMark := false
sc := bufio.NewScanner(file)
for sc.Scan() {
line := sc.Text()
if !isMark {
if strings.HasPrefix(line, mark) {
isMark = true
}
continue
}
if line == "" || strings.HasPrefix(line, "#") {
continue
}
parts := strings.Split(line, "\t")
if len(parts) != 3 {
continue
}
text, code := parts[0], parts[1]
if containsPolyphonicWordsFilter(text) {
continue
}
for _, word := range polyphonicWords {
if strings.Contains(text, word) {
m[text] = append(m[text], code)
}
}
}
// 遍历 m输出单数读音的词汇
for text, codes := range m {
if len(codes)%2 != 0 {
fmt.Println(text)
}
}
}
func containsPolyphonicWordsFilter(text string) bool {
for _, filter := range polyphonicWordsFilter {
if strings.Contains(text, filter) {
return true
}
}
return false
}

View File

@ -1,4 +1,18 @@
# 在 # -_- 上面是错词;下面是包含错词但不是错词。
元文件
桃花园
桃花缘
噌地
伶牙利
灵牙利
碧雪丹心
气嘘嘘
喘嘘嘘
长统袜
长统靴
铢铢较量
量角规
一天一炖
搏彩
知书识理
识理知书
@ -1332,6 +1346,8 @@
年青
谐调
呆会
呆在
呆着
不惟
赢利
作主
@ -3608,3 +3624,4 @@
六西格玛项目
六西格玛黑带
精益六西格玛
图元文件