泰码搜索准确度加强器 TERAGRAM SEARCH ACCURACY ENHANCERSTM
泰码独特的技术能够在词汇、句法以及语义的层次上进行更加丰富的处理。这当中的许多语言技术被应用在搜索查询的预处理阶段,以提高查询的准确性和相关性。目前,这些解决方案可适用主要的欧洲、阿拉伯以及亚洲语言,其中也包括了客户/服务器API以及对Java、Perl的支持。
欧洲和阿拉伯语言软件包
- 形态词根 (Morphological Stemming)
- 拼写检查 (Spelling Correction)
- 词性标记 (Part of Speech Tagging)
- 文本格式化 (Text Normalization)
- 词句表征 (Word and Sentence Tokenizer)
- 语音转换 (Phonetic Transcription)
- 名词短语提取 (Noun Phrase Extraction)
- 语言字符编码识别 (Language & Character Encoding Identification)
- 语言模式匹配 (Linguistic Pattern Matcher (Grep) )
- 相关查询 (Related Queries )
- 自然语言查询 (Natural Language Queries )
- 国际字典 (International Dictionaries )
- 语言搜索 (Linguistic Search )
泰码提供一套完整的亚洲语言工具和字典,用以处理较为复杂的亚洲语言文本。对于处理如汉语、日语和韩语尤为重要。
亚洲语言软件包
- 语言字符编码识别(Language and Character Encoding Identification )
- 字符编码映射(Character Encoding Mapping )
- 形态词根与分割 (Morphological Stemming and Segmentation )
- 分割工具 (Segmentation Tools )
- 语言模式匹配 (Linguistic Pattern Matcher (Grep) )
泰码解决方案对处理海量信息具有可伸缩性,对任意数量的数据都能提供相同的处理速度, 同时以高度压缩的格式对数据进行编码。泰码公司开发并维护了大量的标记字典,其中包括欧洲和亚洲语言在内二十多种语言的数亿词汇。
|