记录一些遇到的经常使用的openfst的命令。help的信息我就不放了,能够本身看。缓存
加一个自旋,通常是在初始节点上。别的节点没试过。。这句在生成L.fst的时候有遇到过。oop
将自回路添加到 FST 的状态以经过它传播消歧符号
它们被添加到每一个最终状态,每一个状态都带有非 epsilon 输出符号
至少在一个弧状态以外。 与预先肯定一块儿使用spa
用法:fstaddselfloops in-disambig-list out-disambig-list [in.fst [out.fst]]
例如:fstaddselfloops in.list out.list <in.fst> withloops.fst日志
fstaddselfloops "echo 122 |" "echo 7 |" | \
#加上自旋,主要是对122 7 的#0进行自旋。注释此句,比较下区别就知道了。
49 #区别: 0 -> 0 [label = "#0:#0", fontsize = 14]; < 0 0 122 7code
对G.fst进行检查,为何作这一步?blog
检查 FST 是否随机,若是有则退出成功。
打印出最大错误(以日志为单位)。排序
用法:fstisstochastic [in.fst]ip
fstisstochastic $outlangdir/G.fst
用法:fsttablecompose(fst1-rxfilename | fst1-rspecifier)(fst2-rxfilename | fst2-rspecifier)[(out-rxfilename | out-rspecifier)]ci
选项:
--compose-filter:使用的合成过滤器,其中之一:“alt_sequence”,“auto”,“match”,“sequence”(string,default =“sequence”)
--connect:若是为 true,则在输出前修剪 FST。 (布尔,默认 = true)
- 匹配侧:进行表匹配的组合的一侧,其中一个:“左” 或 “右”。 (字符串,默认 =“左”)字符串
注意顺序 fsttablecompose A.fst B.fst > C.fst
能够这样简易理解:A a:b/0.4 B b:c/0.3 C a:c/0.7
从简单文本格式建立二进制 FST。最经常使用的一个了。
用法:fstcompile [text.fst [binary.fst]]
标志:
--accept:type = bool,default = false
以接受者格式输入
--allow_negative_labels:type = bool,default = false
容许使用负面标签(不推荐; 可能会致使冲突)
--arc_type:type = string,default =“standard”
输出弧类型
--fst_type:type = string,default =“vector”
输出 FST 类型
--isymbols:type = string,default =“”
输入标签符号表
--keep_isymbols:type = bool,default = false
用 FST 存储输入标签符号表
--keep_osymbols:type = bool,default = false
将输出标签符号表与 FST 一块儿存储
--keep_state_numbering:type = bool,default = false
不要从新编号输入状态
--osymbols:type = string,default =“”
输出标签符号表
--ssymbols:type = string,default =“”
状态标签符号表
库标志:
标志来自:flags.cc
--help:type = bool,default = false
显示使用信息
--helpshort:type = bool,default = false
显示简要的使用信息
--tmpdir:type = string,default =“/ tmp /”
临时目录
--v:type = int32,default = 0
详细级别
标志来自:fst.cc
--fst_align:type = bool,default = false
在适当的地方写入 FST 数据
--fst_default_cache_gc:type = bool,default = true
启用缓存的垃圾回收
--fst_default_cache_gc_limit:type = int64,default = 1048576
缓存触发垃圾回收的字节大小
--fst_read_mode:type = string,default =“read”
可映射文件的默认文件读取模式
--fst_verify_properties:type = bool,default = false
验证由 TestProperties 查询的 fst 属性
--fst_weight_parentheses:type = string,default =“”
包围印刷复合砝码的第一重量(例如配对重量,元组重量和派生类)的字符以确保嵌套复合砝码的正确 I / O; 必须具备大小 0(无)或 2(开括号和右括号)
--fst_weight_separator:type = string,default =“,”
印刷复合重物之间的字符分隔符必须是单个字符
--save_relabel_ipairs:type = string,default =“”
将输入从新标记对保存到文件
--save_relabel_opairs:type = string,default =“”
将输出从新标记对保存到文件
标志来自:symbol-table.cc
--fst_compat_symbols:type = bool,default = true
适当时须要符号表匹配
--fst_field_separator:type = string,default =“”
用做打印字段之间分隔符的字符集
排序 FST 的弧线。排序。
用法:fstarcsort [in.fst [out.fst]]
计划标志:
--sort_type:type = string,default =“ilabel”
比较方法之一:“ilabel”,“olabel”
库标识:
标志来自:flags.cc
--help:type = bool,default = false
显示使用信息
--helpshort:type = bool,default = false
显示简要的使用信息
--tmpdir:type = string,default =“/ tmp /”
临时目录
--v:type = int32,default = 0
详细级别
标志来自:fst.cc
--fst_align:type = bool,default = false
在适当的地方写入 FST 数据
--fst_default_cache_gc:type = bool,default = true
启用缓存的垃圾回收
--fst_default_cache_gc_limit:type = int64,default = 1048576
缓存触发垃圾回收的字节大小
--fst_read_mode:type = string,default =“read”
可映射文件的默认文件读取模式
--fst_verify_properties:type = bool,default = false
验证由 TestProperties 查询的 fst 属性
--fst_weight_parentheses:type = string,default =“”
包围印刷复合砝码的第一重量(例如配对重量,元组重量和派生类)的字符以确保嵌套复合砝码的正确 I / O; 必须具备大小 0(无)或 2(开括号和右括号)
--fst_weight_separator:type = string,default =“,”
印刷复合重物之间的字符分隔符必须是单个字符
--save_relabel_ipairs:type = string,default =“”
将输入从新标记对保存到文件
--save_relabel_opairs:type = string,default =“”
将输出从新标记对保存到文件
标志来自:symbol-table.cc --fst_compat_symbols:type = bool,default = true 适当时须要符号表匹配 --fst_field_separator:type = string,default =“” 用做打印字段之间分隔符的字符集