<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<style type="text/css" style="display:none"><!-- p { margin-top: 0px; margin-bottom: 0px; }--></style>
</head>
<body dir="ltr" style="font-size:12pt;color:#000000;background-color:#FFFFFF;font-family:Calibri,Arial,Helvetica,sans-serif;">
<p>Thanks Marie. Just quick answers (im currently on leave)<br>
</p>
<p><br>
</p>
<p>1. BIE isnt required, but there should be an index on the biocache service machine in the usual place (/data/lucence/namematching). This will then be used for taxon resolution.<br>
</p>
<p><br>
</p>
<p>2. Im surprised this causes an issue. Whitespace in those codes can be an issue.<br>
</p>
<p><br>
</p>
<p>3. Can you supply more detail ? A NPE would suggest a bug or bad config. The way we index large datasets is to use the offline method of indexing using the "bulk-processor" option in the command line tool. <br>
</p>
<p><br>
</p>
<p>Dave</p>
<p><br>
</p>
<div style="color: rgb(33, 33, 33);">
<hr tabindex="-1" style="display:inline-block; width:98%">
<div id="divRplyFwdMsg" dir="ltr"><font face="Calibri, sans-serif" color="#000000" style="font-size:11pt"><b>From:</b> Ala-portal <ala-portal-bounces@lists.gbif.org> on behalf of Marie Elise Lecoq <melecoq@gbif.fr><br>
<b>Sent:</b> 25 May 2016 03:36<br>
<b>To:</b> ala-portal@lists.gbif.org<br>
<b>Subject:</b> [Ala-portal] [Indexation] Questions</font>
<div> </div>
</div>
<div>
<div dir="ltr">
<div>Hi all !</div>
<div><br>
</div>
<div>I  have few questions about the indexation :</div>
<div><br>
</div>
<div>1. It seems that some occurrences are wrongly indexed. For example, if I search "Pica Pica", the three first results will be not relevant (<a href="http://recherche.gbif.fr/occurrences/search?taxa=Pica+pica">http://recherche.gbif.fr/occurrences/search?taxa=Pica+pica</a>).
 Do I need to change something on the nameindexer ? I don't have a BIE instance on our system, do I need to install one in order to help ? </div>
<div><br>
</div>
<div>2. We have some provider codes with punctuation (e.g. comma, dot ). It's seems that the link between collection, institution and dataresource is not made due to this. It works with accents. </div>
<div><br>
</div>
<div>3. I try to index a data resource with more than 20 million occurrences and I have a NullPointerException, it's seems that guid is not found. I can upload data resource with much less data inside so I guess the problem comme from the data resource itself
 (size ?). Do you have a special way to deal with huge data resource ? </div>
<div><br>
</div>
<div>Thanks in advance for your help :-)!</div>
<div>Cheers,</div>
<div>Marie</div>
<br clear="all">
<div><br>
</div>
-- <br>
<div class="gmail_signature">
<div dir="ltr"><img src="https://mail.google.com/mail/u/0/?ui=2&ik=f2990c326c&view=fimg&th=143720bd12d267c4&attid=0.1&disp=inline&safe=1&attbid=ANGjdJ-dPPvdDXYTQLEz3sMkSC8MXmmlvNMhRcnZ-5COf76BRKDzNBzALARmrD-ZLTteeCriuqRYcwDCZxnWA6ZjOt8rVgydWnc6h2aRU_hfLDYFdDAPI0uUiC8Do9o&ats=1389188740078&rm=143720bd12d267c4&zw&sz=w1325-h522"><br>
</div>
</div>
</div>
</div>
</div>
</body>
</html>