泰码搜索准确度加强器
TERAGRAM SEARCH ACCURACY ENHANCERSTM

      泰码独特的技术能够在词汇、句法以及语义的层次上进行更加丰富的处理。这当中的许多语言技术被应用在搜索查询的预处理阶段,以提高查询的准确性和相关性。目前,这些解决方案可适用主要的欧洲、阿拉伯以及亚洲语言,其中也包括了客户/服务器API以及对Java、Perl的支持。

欧洲和阿拉伯语言软件包
  • 形态词根 (Morphological Stemming)
  • 拼写检查 (Spelling Correction)
  • 词性标记 (Part of Speech Tagging)
  • 文本格式化 (Text Normalization)
  • 词句表征 (Word and Sentence Tokenizer)
  • 语音转换 (Phonetic Transcription)
  • 名词短语提取 (Noun Phrase Extraction)
  • 语言字符编码识别 (Language & Character Encoding Identification)
  • 语言模式匹配 (Linguistic Pattern Matcher (Grep) )
  • 相关查询 (Related Queries )
  • 自然语言查询 (Natural Language Queries )
  • 国际字典 (International Dictionaries )
  • 语言搜索 (Linguistic Search )

      泰码提供一套完整的亚洲语言工具和字典,用以处理较为复杂的亚洲语言文本。对于处理如汉语、日语和韩语尤为重要。

亚洲语言软件包
  • 语言字符编码识别(Language and Character Encoding Identification )
  • 字符编码映射(Character Encoding Mapping )
  • 形态词根与分割 (Morphological Stemming and Segmentation )
  • 分割工具 (Segmentation Tools )
  • 语言模式匹配 (Linguistic Pattern Matcher (Grep) )

      泰码解决方案对处理海量信息具有可伸缩性,对任意数量的数据都能提供相同的处理速度, 同时以高度压缩的格式对数据进行编码。泰码公司开发并维护了大量的标记字典,其中包括欧洲和亚洲语言在内二十多种语言的数亿词汇。


 
 
Back to Solutions

©2006 Teragram Corp.