Termbot是一款基于人工智能百度千帆的术语提取工具。不同于其他术语提取工具,Termbot是通过人工智能对于中文的理解来提取术语,能够准确地将术语提取出来。百度千帆和ChatGPT在中文理解上不相上下,在某种程度上百度千帆甚至略强于ChatGPT。
先决条件
要使用术语提取工具Termbot,您需要先注册百度千帆。创建账户成功后,请转移到以下链接创建的自己的应用(例如,术语提取)。
https://console.bce.baidu.com/qianfan/ais/console/applicationConsole/application
创建成功后,如下将会获得APPID等。
接着需要转到此路径下,使用手机激活Access Key 和Secrect Key
https://console.bce.baidu.com/iam/#/iam/accesslist
您可以在自己的百度千帆账户中充一些费用,以便日后使用。
激活程序
请打开Termbot,点击License菜单,将自动生成的机器码发送给我们。在获取许可证后,填入许可证即可正常使用程序了。
提取术语
首先转到Termbot的Settings下,将如上所示的APPID、Access Key 和Secrect Key填入。
填入密钥后,程序会记住密钥信息,此后无需再填写。您填入的密钥会被隐藏掉。要显示密钥,可勾选Show复选框。
接着可采用以下步骤提取术语:
- 点击Add files或Add files from folder添加要处理的文件;
- 选择人工智能模型,推荐选择ERNIE Bot 4。ERNIE Bot 4是对标ChatGPT 4的人工智能模型。
- 选择要生成的Excel术语表存储路径。
- 最后点击Extract按钮,程序将自动处理,并最终生成不包含重复术语的Excel表单。
整个过程是基于人工智能的理解来提取术语,两万字大概三分可完成。整个过程中,需要保持稳定的网络连接,切勿使用梯/子之类的网络访问工具。