<div dir="ltr"><div>Hello all,</div><div><br></div><div>Thanks again for your help. </div><div>The 10 years anniversary of GBIF France went well (I guess), nobody told us that it was bad so ...</div><div><br></div><div>I sent a lot of questions the last few weeks and I would like to give solutions that I found for my issues. It could help others people :-). </div><div><br></div><div>INDEXATION : </div><div><br></div><div>1. About the wrong indexation, I found two bugs on the checklist used for the name indexing :</div><div>- some of species don't have the entire classification (e.g. <a href="http://www.gbif.org/species/4814179">http://www.gbif.org/species/4814179</a>)</div><div>- some of them send a NullPointerException (see error below) when I ran the searchText command directly on the server.</div><div><br></div><div><div><font size="1">$ sudo nameindexer -testSearch "Canis familiaris Linnaeus, 1758"</font></div><div><font size="1">org.apache.lucene.index.IndexFormatTooNewException: Format version is not supported (resource: MMapIndexInput(path="/data/lucene/namematching/cb/segments.gen")): -3 (needs to be between -2 and -2)</font></div><div><font size="1"><span class="" style="white-space:pre">   </span>at org.apache.lucene.index.SegmentInfos$FindSegmentsFile.run(SegmentInfos.java:722)</font></div><div><font size="1"><span class="" style="white-space:pre">    </span>at org.apache.lucene.index.StandardDirectoryReader.open(StandardDirectoryReader.java:52)</font></div><div><font size="1"><span class="" style="white-space:pre">       </span>at org.apache.lucene.index.DirectoryReader.open(DirectoryReader.java:65)</font></div><div><font size="1"><span class="" style="white-space:pre">       </span>at au.org.ala.names.search.ALANameSearcher.<init>(ALANameSearcher.java:117)</font></div><div><font size="1"><span class="" style="white-space:pre">      </span>at au.org.ala.names.search.DwcaNameIndexer.main(DwcaNameIndexer.java:488)</font></div></div><div><br></div><div><br></div><div>2. I still got issues with the punctuation or space in provider codes. My future work will focus on this.</div><div><br></div><div>3. I have successfully uploaded my dataset with more than 20 millions occurrences by following those steps :</div><div>  a.   I uploaded a DwCArchive with 15 occurrences in order to create the dataset into the system. I need to do this because the Zip File library using in biocache store can't open a file bigger than 1Go. </div><div>  b.  I copied the real DwC-Archive instead of the fake one on the /collectory/upload/ folder</div><div>  c.  I asked our system administrator to increase the RAM in our Virtual Machine (from 4Go to 80Go).</div><div>  d.  I made some correction into the collectory-pluggin (you can see my email that I sent on June, 1st) and the load, process and indexation works well after this. It took ages but it worked.   </div><div>  e.  Our data is now visible into our portal (<a href="http://metadonnee.gbif.fr/public/showDataResource/dr179">http://metadonnee.gbif.fr/public/showDataResource/dr179</a>) </div><div>I'm not sure it's the good way to do it but it works !</div><div><br></div><div><br></div><div>SPATIAL :</div><div><br></div><div>I removed all the tools using environmental layers but I will be really interested by a training about it in order to install it :-)! </div><div><br></div><div><br></div><div>DATA :</div><div><br></div><div>For my error with Institution UID instead of name, I just changed <br>







<span class="">"caches.collections.</span><span class="">enable</span><span class="">d"</span> to true in the configuration file of biocache and it works perfectly.</div><div><br></div><div>Thanks again!</div><div>cheers,</div><div>Marie</div><br clear="all"><div><br></div>-- <br><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><img src="https://mail.google.com/mail/u/0/?ui=2&ik=f2990c326c&view=fimg&th=143720bd12d267c4&attid=0.1&disp=inline&safe=1&attbid=ANGjdJ-dPPvdDXYTQLEz3sMkSC8MXmmlvNMhRcnZ-5COf76BRKDzNBzALARmrD-ZLTteeCriuqRYcwDCZxnWA6ZjOt8rVgydWnc6h2aRU_hfLDYFdDAPI0uUiC8Do9o&ats=1389188740078&rm=143720bd12d267c4&zw&sz=w1325-h522"><br></div></div></div>