dict: 日常更新
This commit is contained in:
parent
6a1c50649f
commit
bd2b6ba021
@ -33,7 +33,7 @@
|
||||
# 需要注音的字词设定在 others/script/rime/需要注音.txt
|
||||
---
|
||||
name: 8105
|
||||
version: "2023-08-27"
|
||||
version: "2023-09-03"
|
||||
sort: by_weight
|
||||
...
|
||||
### 按需启用
|
||||
@ -3327,6 +3327,7 @@ sort: by_weight
|
||||
柯 ke 71973
|
||||
棵 ke 58780
|
||||
壳 ke 41877
|
||||
氪 ke 35000
|
||||
磕 ke 34654
|
||||
嗑 ke 31720
|
||||
珂 ke 16769
|
||||
@ -3346,7 +3347,6 @@ sort: by_weight
|
||||
髁 ke 232
|
||||
骒 ke 91
|
||||
缂 ke 79
|
||||
氪 ke 30
|
||||
牁 ke 14
|
||||
匼 ke 3
|
||||
炣 ke 0
|
||||
@ -8194,6 +8194,7 @@ sort: by_weight
|
||||
至 zhi 1199059
|
||||
之 zhi 1173763
|
||||
指 zhi 1099010
|
||||
值 zhi 920306
|
||||
制 zhi 870792
|
||||
支 zhi 532396
|
||||
志 zhi 485065
|
||||
@ -8203,7 +8204,6 @@ sort: by_weight
|
||||
置 zhi 379704
|
||||
致 zhi 370734
|
||||
职 zhi 326699
|
||||
值 zhi 320306
|
||||
智 zhi 310406
|
||||
纸 zhi 273013
|
||||
织 zhi 218959
|
||||
|
File diff suppressed because it is too large
Load Diff
File diff suppressed because it is too large
Load Diff
@ -8,7 +8,7 @@
|
||||
#
|
||||
---
|
||||
name: others
|
||||
version: "2023-08-15"
|
||||
version: "2023-09-03"
|
||||
sort: by_weight
|
||||
...
|
||||
##### 容错词
|
||||
@ -142,6 +142,8 @@ sort: by_weight
|
||||
太行山 tai xing shan
|
||||
歇斯底里 xie si di li
|
||||
歇斯底里 jie si di li
|
||||
暖和 nuan huo
|
||||
暖和 nuan he
|
||||
### 错字
|
||||
曾经 ceng jing
|
||||
曾今 ceng jin
|
||||
|
File diff suppressed because it is too large
Load Diff
@ -7,7 +7,7 @@
|
||||
#
|
||||
---
|
||||
name: en_ext
|
||||
version: "2023-08-27"
|
||||
version: "2023-09-03"
|
||||
sort: by_weight
|
||||
...
|
||||
# 一些杂项
|
||||
@ -1644,9 +1644,7 @@ Windows Windows
|
||||
Microsoft Microsoft
|
||||
Nintendo Nintendo
|
||||
Google Google
|
||||
Nexus Nexus
|
||||
nexus nexus
|
||||
Pixel Pixel
|
||||
Wii U WiiU
|
||||
Wii Wii
|
||||
Oracle Oracle
|
||||
@ -2262,3 +2260,6 @@ C# C#
|
||||
C# Csharp
|
||||
C# Cjing
|
||||
decode decode
|
||||
KeyCastr KeyCastr
|
||||
Laugh Tale LaughTale
|
||||
Joy Boy JoyBoy
|
||||
|
@ -71,6 +71,7 @@ local corrections = {
|
||||
["tiao huan"] = { text = "调换", comment = "diao huan" },
|
||||
["tai xing shan"] = { text = "太行山", comment = "tai hang shan" },
|
||||
["jie si di li"] = { text = "歇斯底里", comment = "xie si di li" },
|
||||
["nuan he"] = { text = "暖和", comment = "nuan huo" },
|
||||
-- 错字
|
||||
["ceng jin"] = { text = "曾今", comment = "曾经" },
|
||||
["an nai"] = { text = "按耐", comment = "按捺(na)" },
|
||||
|
@ -210,8 +210,10 @@ respect respect 🫡
|
||||
忧虑 忧虑 😔
|
||||
忧伤 忧伤 😔
|
||||
困 困 😪 🥱
|
||||
困困 困困 😪
|
||||
困了 困了 😪 🥱
|
||||
困倦 困倦 😪 🥱
|
||||
困乏 困乏 😪
|
||||
瞌睡 瞌睡 😪
|
||||
打瞌睡 打瞌睡 😪
|
||||
口水 口水 🤤
|
||||
@ -509,6 +511,8 @@ angry angry 😡 😠 💢
|
||||
送你一颗心 送你一颗心 💝
|
||||
闪亮的心 闪亮的心 💖
|
||||
爱心 爱心 💖 ♥️
|
||||
感谢 感谢 💖 🙏
|
||||
谢谢 谢谢 💖 🙏
|
||||
膨胀的心 膨胀的心 💗
|
||||
膨胀的爱心 膨胀的爱心 💗
|
||||
搏动的心 搏动的心 💗
|
||||
@ -816,7 +820,6 @@ OK OK 👌 🙆♂️ 🙆♀️ 🆗
|
||||
拜托 拜托 🙏
|
||||
祈求 祈求 🙏
|
||||
祈祷 祈祷 🙏
|
||||
谢谢 谢谢 🙏
|
||||
超度 超度 🙏
|
||||
阿弥陀佛 阿弥陀佛 🙏
|
||||
写字 写字 ✍️
|
||||
@ -2045,6 +2048,9 @@ bug bug 🐛
|
||||
鱼饼 鱼饼 🍥
|
||||
鱼板 鱼板 🍥
|
||||
月饼 月饼 🥮
|
||||
月团 月团 🥮
|
||||
丰收饼 丰收饼 🥮
|
||||
团圆饼 团圆饼 🥮
|
||||
团子 团子 🍡
|
||||
糯米团 糯米团 🍡
|
||||
饺子 饺子 🥟
|
||||
@ -2096,6 +2102,8 @@ cookies cookies 🍪
|
||||
朱古力 朱古力 🍫
|
||||
朱古力棒 朱古力棒 🍫
|
||||
糖果 糖果 🍬
|
||||
糖 糖 🍬
|
||||
吃糖 吃糖 🍬
|
||||
棒棒糖 棒棒糖 🍭
|
||||
蛋奶糕 蛋奶糕 🍮
|
||||
甜品 甜品 🍮
|
||||
@ -2104,14 +2112,17 @@ cookies cookies 🍪
|
||||
蜜罐 蜜罐 🍯
|
||||
蜂蜜 蜂蜜 🍯
|
||||
奶瓶 奶瓶 🍼
|
||||
喝奶 喝奶 🍼
|
||||
一杯奶 一杯奶 🥛
|
||||
牛奶杯 牛奶杯 🥛
|
||||
牛奶 牛奶 🥛
|
||||
杯子 杯子 🥛
|
||||
玻璃杯 玻璃杯 🥛
|
||||
咖啡 咖啡 ☕
|
||||
咖啡杯 咖啡杯 ☕
|
||||
喝咖啡 喝咖啡 ☕
|
||||
茶壶 茶壶 🫖
|
||||
一壶茶 一壶茶 🫖
|
||||
一壶 一壶 🫖
|
||||
茶 茶 🍵
|
||||
茶水 茶水 🍵
|
||||
茶杯 茶杯 🍵
|
||||
@ -2126,11 +2137,15 @@ cookies cookies 🍪
|
||||
热带水果饮料 热带水果饮料 🍹
|
||||
水果饮料 水果饮料 🍹
|
||||
果饮 果饮 🍹
|
||||
冷饮 冷饮 🍹
|
||||
啤酒 啤酒 🍺
|
||||
干杯 干杯 🍻 🥂
|
||||
碰杯 碰杯 🍻 🥂
|
||||
威士忌 威士忌 🥃
|
||||
平底杯 平底杯 🥃
|
||||
一杯酒 一杯酒 🥃
|
||||
一杯 一杯 🥃
|
||||
玻璃杯 玻璃杯 🥃
|
||||
倾倒液体 倾倒液体 🫗
|
||||
倾倒 倾倒 🫗
|
||||
流出 流出 🫗
|
||||
@ -2981,6 +2996,7 @@ T恤衫 T恤衫 👕
|
||||
钻戒 钻戒 💍
|
||||
求婚戒 求婚戒 💍
|
||||
订婚戒 订婚戒 💍
|
||||
星钻 星钻 💍
|
||||
宝石 宝石 💎
|
||||
钻石 钻石 💎
|
||||
已静音的扬声器 已静音的扬声器 🔇
|
||||
|
@ -1,7 +1,7 @@
|
||||
# Emoji 映射表
|
||||
# 根据此文件生成 emoji.txt
|
||||
#
|
||||
# version: 2023-08-27
|
||||
# version: 2023-09-03
|
||||
#
|
||||
# 中文映射由 Dvel 纯手工打造 https://github.com/iDvel/rime-ice
|
||||
#
|
||||
@ -86,7 +86,7 @@ S$ 新加坡元 新加坡币
|
||||
# face-sleepy
|
||||
😌 如释重负 松了口气 松口气 释然
|
||||
😔 低头忧伤 心事重重 忧虑 忧伤
|
||||
😪 困 困了 困倦 瞌睡 打瞌睡
|
||||
😪 困 困困 困了 困倦 困乏 瞌睡 打瞌睡
|
||||
🤤 口水 流口水 垂涎三尺
|
||||
😴 睡觉 睡着 睡着了 睡了 睡眠
|
||||
# face-unwell
|
||||
@ -173,7 +173,7 @@ S$ 新加坡元 新加坡币
|
||||
💌 情书
|
||||
💘 一箭穿心 丘比特 心中箭了
|
||||
💝 爱的礼物 系有缎带的心 饰以丝带的心 送你一颗心
|
||||
💖 闪亮的心 爱心
|
||||
💖 闪亮的心 爱心 感谢 谢谢
|
||||
💗 膨胀的心 膨胀的爱心 搏动的心
|
||||
💓 心动 心跳 爱情 love
|
||||
💞 旋转的心 舞动的心 心连心
|
||||
@ -254,7 +254,7 @@ S$ 新加坡元 新加坡币
|
||||
👐 双手张开 张开双手
|
||||
🤲 双手手掌向上 掌心向上托起 双手 捧着
|
||||
🤝 握手 合作 合作愉快 搞定
|
||||
🙏 双手合十 合十 合掌 拜托 祈求 祈祷 求你了 求求你 求求你了 谢谢 超度 阿弥陀佛
|
||||
🙏 双手合十 合十 合掌 拜托 祈求 祈祷 求你了 求求你 求求你了 感谢 谢谢 超度 阿弥陀佛
|
||||
# hand-prop
|
||||
✍️ 写字 手写
|
||||
💅 指甲油 涂指甲油 美甲 做指甲 做美甲
|
||||
@ -847,7 +847,7 @@ S$ 新加坡元 新加坡币
|
||||
🍣 寿司
|
||||
🍤 炸虾 天妇罗
|
||||
🍥 盘绕是炸鱼饼 鱼饼 鱼板
|
||||
🥮 月饼
|
||||
🥮 月饼 月团 丰收饼 团圆饼
|
||||
🍡 团子 糯米团
|
||||
🥟 饺子 水饺
|
||||
🥠 幸运饼干
|
||||
@ -869,25 +869,25 @@ S$ 新加坡元 新加坡币
|
||||
🧁 纸杯蛋糕
|
||||
🥧 派 油酥点心 点心
|
||||
🍫 巧克力 巧克力棒 朱古力 朱古力棒
|
||||
🍬 糖果
|
||||
🍬 糖果 糖 吃糖
|
||||
🍭 棒棒糖
|
||||
🍮 蛋奶糕 甜品 甜点 布丁
|
||||
🍯 蜜罐 蜂蜜
|
||||
# drink
|
||||
🍼 奶瓶
|
||||
🥛 一杯奶 牛奶杯 牛奶 杯子 玻璃杯
|
||||
☕ 咖啡 咖啡杯
|
||||
🫖 茶壶
|
||||
🍼 奶瓶 喝奶
|
||||
🥛 一杯奶 牛奶杯 牛奶 杯子
|
||||
☕ 咖啡 咖啡杯 喝咖啡
|
||||
🫖 茶壶 一壶茶 一壶
|
||||
🍵 茶 茶水 茶杯
|
||||
🍶 清酒
|
||||
🍾 开香槟 香槟
|
||||
🍷 葡萄酒 酒杯 酒
|
||||
🍸 鸡尾酒
|
||||
🍹 热带饮料 热带水果饮料 水果饮料 果饮
|
||||
🍹 热带饮料 热带水果饮料 水果饮料 果饮 冷饮
|
||||
🍺 啤酒
|
||||
🍻 干杯 碰杯
|
||||
🥂 干杯 碰杯
|
||||
🥃 威士忌 平底杯
|
||||
🥃 威士忌 平底杯 一杯酒 一杯 玻璃杯
|
||||
🫗 倾倒液体 倾倒 流出
|
||||
🥤 外带杯子 带吸管杯 吸管杯 饮料
|
||||
🧋 波霸奶茶 珍珠奶茶 奶茶 一杯奶茶
|
||||
@ -1269,7 +1269,7 @@ S$ 新加坡元 新加坡币
|
||||
⛑️ 安全帽 白十字头盔 白十字安全帽 十字安全帽 十字头盔
|
||||
📿 念珠
|
||||
💄 口红 唇膏
|
||||
💍 戒指 钻戒 求婚戒 订婚戒
|
||||
💍 戒指 钻戒 求婚戒 订婚戒 星钻
|
||||
💎 宝石 钻石
|
||||
# sound
|
||||
🔇 已静音的扬声器 扬声器关闭 静音
|
||||
|
@ -11,19 +11,23 @@ import (
|
||||
|
||||
func main() {
|
||||
log.SetFlags(log.LstdFlags | log.Lshortfile)
|
||||
|
||||
if len(os.Args) > 1 {
|
||||
if os.Args[1] == "sort" {
|
||||
switch os.Args[1] {
|
||||
case "s":
|
||||
goto SORT
|
||||
}
|
||||
if os.Args[1] == "temp" {
|
||||
case "t":
|
||||
rime.Temp()
|
||||
return
|
||||
case "p":
|
||||
rime.CheckPolyphone(rime.BasePath)
|
||||
return
|
||||
case "tp":
|
||||
rime.Pinyin(filepath.Join(rime.RimeDir, "cn_dicts/temp"))
|
||||
return
|
||||
}
|
||||
}
|
||||
|
||||
// 临时
|
||||
rime.Temp()
|
||||
|
||||
// Emoji 检查和更新
|
||||
rime.CheckAndGenerateEmoji()
|
||||
fmt.Println("--------------------------------------------------")
|
||||
|
@ -7,14 +7,17 @@ import (
|
||||
"os"
|
||||
"strconv"
|
||||
"strings"
|
||||
"unicode/utf8"
|
||||
)
|
||||
|
||||
// 一些临时用的函数
|
||||
|
||||
func Temp() {
|
||||
// defer os.Exit(11)
|
||||
//
|
||||
// GeneratePinyinTest("你的行动力")
|
||||
// GeneratePinyinTest("都挺长的")
|
||||
// GeneratePinyinTest("血条长")
|
||||
|
||||
findP(BasePath, "谁")
|
||||
}
|
||||
|
||||
// 列出字表中多音字的状况:是否参与自动注音
|
||||
@ -83,3 +86,55 @@ func polyphone() {
|
||||
}
|
||||
}
|
||||
}
|
||||
|
||||
// 在字典中找到此行是否包含同义多音字,如果包含切长度大于等于3,从文件中删除这行,并将所有删除的行写入到 1.txt 中
|
||||
func findP(dictPath string, ch string) {
|
||||
// open file
|
||||
file, err := os.OpenFile(dictPath, os.O_RDWR, 0666)
|
||||
if err != nil {
|
||||
log.Fatalln(err)
|
||||
}
|
||||
defer file.Close()
|
||||
|
||||
outFile, err := os.Create("1.txt")
|
||||
if err != nil {
|
||||
log.Fatalln(err)
|
||||
}
|
||||
defer outFile.Close()
|
||||
|
||||
lines := make([]string, 0)
|
||||
|
||||
isMark := false
|
||||
sc := bufio.NewScanner(file)
|
||||
for sc.Scan() {
|
||||
line := sc.Text()
|
||||
if !isMark {
|
||||
lines = append(lines, line)
|
||||
if line == mark {
|
||||
isMark = true
|
||||
}
|
||||
continue
|
||||
}
|
||||
if line == "" || strings.HasPrefix(line, "#") {
|
||||
lines = append(lines, line)
|
||||
continue
|
||||
}
|
||||
parts := strings.Split(line, "\t")
|
||||
if len(parts) != 3 {
|
||||
log.Fatalln("len(parts) != 3", line)
|
||||
}
|
||||
text := parts[0]
|
||||
if strings.Contains(text, ch) && utf8.RuneCountInString(text) >= 3 {
|
||||
outFile.WriteString(line + "\n")
|
||||
} else {
|
||||
lines = append(lines, line)
|
||||
}
|
||||
}
|
||||
|
||||
// 从 lines 重新写入 file
|
||||
file.Truncate(0)
|
||||
file.Seek(0, 0)
|
||||
for _, line := range lines {
|
||||
file.WriteString(line + "\n")
|
||||
}
|
||||
}
|
||||
|
@ -44,8 +44,6 @@ var onlyOne = map[string]string{
|
||||
"私钥": "si yao",
|
||||
"甲壳": "jia ke",
|
||||
"掉色": "diao se",
|
||||
"变色": "bian se",
|
||||
"上色": "shang se",
|
||||
"怎么着": "zen me zhe",
|
||||
"这么着": "zhe me zhe",
|
||||
"那么着": "na me zhe",
|
||||
|
94
others/script/rime/polyphone.go
Normal file
94
others/script/rime/polyphone.go
Normal file
@ -0,0 +1,94 @@
|
||||
package rime
|
||||
|
||||
import (
|
||||
"bufio"
|
||||
"fmt"
|
||||
"log"
|
||||
"os"
|
||||
"strings"
|
||||
)
|
||||
|
||||
// 同义多音字
|
||||
var polyphonicWords = []string{
|
||||
"谁",
|
||||
"血",
|
||||
"熟",
|
||||
"掴",
|
||||
"爪",
|
||||
"薄",
|
||||
"剥",
|
||||
"哟",
|
||||
"嚼",
|
||||
"忒", // te 不是,tui 和 tei 是
|
||||
"密钥",
|
||||
"公钥",
|
||||
"私钥",
|
||||
"甲壳",
|
||||
"掉色",
|
||||
}
|
||||
|
||||
// 不检查的词汇
|
||||
var polyphonicWordsFilter = []string{
|
||||
"咀嚼",
|
||||
"薄暮", "薄地", "薄海", "薄酒", "薄礼", "薄面", "薄命", "薄情", "薄弱", "薄田", "薄物细故", "薄幸", "薄情", "薄葬", "厌薄", "厚积薄发", "履薄临深", "德薄望轻", "菲薄", "履薄", "孤军薄旅", "薄太后",
|
||||
"剥离", "剥夺", "剥削", "剥落", "剥蚀", "剥啄",
|
||||
"熟稔", "黄熟",
|
||||
}
|
||||
|
||||
// CheckPolyphone 检查 base、ext 中同义多音字是否有两种读音
|
||||
// 例如「谁的」应该同时存在 shei de 与 shui de 两种读音
|
||||
func CheckPolyphone(dictPath string) {
|
||||
file, err := os.Open(dictPath)
|
||||
if err != nil {
|
||||
log.Fatalln(err)
|
||||
}
|
||||
defer file.Close()
|
||||
|
||||
// 将含有同义多音字的词汇放入,key 为词汇,value 为注音
|
||||
// 如果注音数组只有一个,则应该补充其他读音
|
||||
m := make(map[string][]string)
|
||||
|
||||
isMark := false
|
||||
sc := bufio.NewScanner(file)
|
||||
for sc.Scan() {
|
||||
line := sc.Text()
|
||||
if !isMark {
|
||||
if strings.HasPrefix(line, mark) {
|
||||
isMark = true
|
||||
}
|
||||
continue
|
||||
}
|
||||
if line == "" || strings.HasPrefix(line, "#") {
|
||||
continue
|
||||
}
|
||||
parts := strings.Split(line, "\t")
|
||||
if len(parts) != 3 {
|
||||
continue
|
||||
}
|
||||
text, code := parts[0], parts[1]
|
||||
if containsPolyphonicWordsFilter(text) {
|
||||
continue
|
||||
}
|
||||
for _, word := range polyphonicWords {
|
||||
if strings.Contains(text, word) {
|
||||
m[text] = append(m[text], code)
|
||||
}
|
||||
}
|
||||
}
|
||||
|
||||
// 遍历 m,输出单数读音的词汇
|
||||
for text, codes := range m {
|
||||
if len(codes)%2 != 0 {
|
||||
fmt.Println(text)
|
||||
}
|
||||
}
|
||||
}
|
||||
|
||||
func containsPolyphonicWordsFilter(text string) bool {
|
||||
for _, filter := range polyphonicWordsFilter {
|
||||
if strings.Contains(text, filter) {
|
||||
return true
|
||||
}
|
||||
}
|
||||
return false
|
||||
}
|
@ -1,4 +1,18 @@
|
||||
# 在 # -_- 上面是错词;下面是包含错词但不是错词。
|
||||
元文件
|
||||
桃花园
|
||||
桃花缘
|
||||
噌地
|
||||
伶牙利
|
||||
灵牙利
|
||||
碧雪丹心
|
||||
气嘘嘘
|
||||
喘嘘嘘
|
||||
长统袜
|
||||
长统靴
|
||||
铢铢较量
|
||||
量角规
|
||||
一天一炖
|
||||
搏彩
|
||||
知书识理
|
||||
识理知书
|
||||
@ -1332,6 +1346,8 @@
|
||||
年青
|
||||
谐调
|
||||
呆会
|
||||
呆在
|
||||
呆着
|
||||
不惟
|
||||
赢利
|
||||
作主
|
||||
@ -3608,3 +3624,4 @@
|
||||
六西格玛项目
|
||||
六西格玛黑带
|
||||
精益六西格玛
|
||||
图元文件
|
||||
|
Loading…
Reference in New Issue
Block a user