公式サイトに従ってソロを学ぶ(二):Dockment、Field説明
4223 ワード
前のページ(http://blog.csdn.net/peppengliu/article/details/51463918)ソロテスト環境の設置を行いました.本編ではソロ中のdocumentとfieldを勉強します.
以下はdocument、field及び関連概念を紹介します.
document:ドキュメントはインデックスの基本単位であり、インデックスデータの記述のセットです.documentはfieldで構成されています.簡単なdocumentの例は以下の通りです.
copyField(copyFieldによって定義される)、dynamicField(dynamicFieldによって定義される).
field anlysis:field値分析器は、fieldドメインにおけるvalueの分析方法を定義しています.fieldが追加処理を必要とする場合(分詞、フィルタなど)はこの項目を定義します.典型的な構成は以下の通りです.
以上の構成はすべてschema.xmlに配置されています.他の構成項目を知りたいので、参考してください.http://wiki.apache.org/solr/SchemaXml
本論文の主な参考http://wiki.apache.org/solr/SchemaXmlおよびhttps://cwiki.apache.org/confluence/display/solr/Apache+Solr+Reference+ガイド、総括不足のところがあります.
以下はdocument、field及び関連概念を紹介します.
document:ドキュメントはインデックスの基本単位であり、インデックスデータの記述のセットです.documentはfieldで構成されています.簡単なdocumentの例は以下の通りです.
{"id":"138761234112","goods_name":"product","value":12}
field:documentの構成部分は、インデックスデータのより詳細な情報を記述しています.document内の各fieldのデータタイプを定義しました.定義によると、必須属性name、typeといくつかのオプション属性が含まれています.nameはインデックスデータのフィールド名に対応しています.typeはインデックスデータタイプに対応しています.オプション属性は下記の通りです.default
The default value for this field if none is provided while adding documents
indexed=true|false
True if this field should be "indexed". If (and only if) a field is indexed, then it is searchable, sortable, and facetable.
stored=true|false
True if the value of the field should be retrievable during a search, or if you're using highlighting or MoreLikeThis.
compressed=true|false
True if this field should be stored using gzip compression. (This will only apply if the field type is compressible; among the standard field types, only TextField and StrField are.)
compressThreshold=
multiValued=true|false
True if this field may contain multiple values per document, i.e. if it can appear multiple times in a document
omitNorms=true|false
This is arguably an advanced option.
Set to true to omit the norms associated with this field (this disables length normalization and index-time boosting for the field, and saves some memory). Only full-text fields or fields that need an index-time boost need norms.
termVectors=false|true > Solr 1.1
If set, include full term vector info.
If enabled, often also used with termPositions="true" and termOffsets="true".
To use interactively, requires TermVectorComponent
Corresponds to TV button in Luke, and V field attribute.
omitTermFreqAndPositions=true|false Solr1.4
If set, omit term freq, positions and payloads from postings for this field. This can be a performance boost for fields that don't require that information and reduces storage space required for the index. Queries that rely on position that are issued on a field with this option fail with an exception. Prior to Solr4.0 the queries would silently fail to find documents.
omitPositions=true|false Solr3.4
If set, omits positions, but keeps term frequencies
fieldは以下の種類に分けられます.define fields(fieldによって定義されます)、copyField(copyFieldによって定義される)、dynamicField(dynamicFieldによって定義される).
field anlysis:field値分析器は、fieldドメインにおけるvalueの分析方法を定義しています.fieldが追加処理を必要とする場合(分詞、フィルタなど)はこの項目を定義します.典型的な構成は以下の通りです.
この設定型はtext_という名前を定義しています.generalのデータタイプは、fieldのtypeがtext_generalの場合、自動的にそのfieldの値にこのラベルで定義された種類を使用してfieldの値を処理します.以上の構成はすべてschema.xmlに配置されています.他の構成項目を知りたいので、参考してください.http://wiki.apache.org/solr/SchemaXml
本論文の主な参考http://wiki.apache.org/solr/SchemaXmlおよびhttps://cwiki.apache.org/confluence/display/solr/Apache+Solr+Reference+ガイド、総括不足のところがあります.