本地化行业使用CAT工具分析字数,客户和供应商之间出现字数不一致的情况,很多时候是因为CAT工具的设置和版本差异等因素造成的,当中具体情况,有非常多值得分享的内容。今天,我们仅说下传统翻译界的字数分析,传统翻译界往往使用Word统计字数,但是因为版本的差异,分析的字数往往会有较大的差异。我们对Word 2007 和 Word 2010的字数统计进行了比较。
西文字数统计比较
一篇原文为西文的文件,使用Word 2007、Word 2010分别统计的字数结果如下:
Word 2007字数结果
Word 2010字数结果
从上图中,Word 2007和Word 2010的字符数完全一样,但是字数差距很大,Word 2007的字数比Word 2010字数少数万,“尤其是大项目,一万字左右的文件,会差1000多字,10万字以上的项目会差1万字左右”,一位长期从事西语项目的企业界朋友,也反映了这样的情况。
我们将文件拷贝到记事本中,然后拷贝回Word以纯文本方式统计字数:
Word 2007纯文本
Word 2010纯文本
在纯文本情况下,字符数和字数相差不大,总字数也几乎一致。通过比较,我们可以得出这样的结论,Word 2010的字数统计更为准确。在复杂格式文本情况下,Word 2007统计的字数要少于Word 2010。
中文字数统计比较
我们对多个带复杂格式的较大的中文文件的字数进行了比较。
Word 2007中文
Word 2010中文
分析结果显示,字符数和字数基本一致。
同一文件,使用纯文本方式比较。
Word 2007中文纯文本
Word 2010中文纯文本
分析结果也一样,字符数和字数基本一致。
通过比较,我们可以得出这样的结论,Word 2007和Word 2011不论是在复杂文本或纯文本格式情况下,中文字数统计基本一致。