<html dir="ltr">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
<style type="text/css" id="owaParaStyle"></style>
</head>
<body style="word-wrap:break-word" fpstyle="1" ocsi="0">
<div style="direction: ltr;font-family: Tahoma;color: #000000;font-size: 10pt;">Thanks guys.
<div><br>
</div>
<div>There are details on how to build in the README.md, but the build the steps to make a full executable are in the ansible scripts (see the role nameindexer [1]).</div>
<div><br>
</div>
<div>Dave</div>
<div><br>
</div>
<div>[1]&nbsp;https://github.com/AtlasOfLivingAustralia/ala-install/tree/master/ansible/roles/nameindexer</div>
<div><br>
<div style="font-family: Times New Roman; color: #000000; font-size: 16px">
<hr tabindex="-1">
<div id="divRpF440431" style="direction: ltr;"><font face="Tahoma" size="2" color="#000000"><b>From:</b> ala-portal-bounces@lists.gbif.org [ala-portal-bounces@lists.gbif.org] on behalf of Tim Robertson [trobertson@gbif.org]<br>
<b>Sent:</b> 04 September 2014 23:25<br>
<b>To:</b> Santiago Martinez de la Riva<br>
<b>Cc:</b> ala-portal@lists.gbif.org<br>
<b>Subject:</b> Re: [Ala-portal] Problem generating a new name index<br>
</font><br>
</div>
<div></div>
<div>Hi Santiago
<div><br>
</div>
<div>This is likely to need ALA folks, but since they are asleep, this might give you some ideas to explore before they come online.</div>
<div><br>
</div>
<div>I’ve logged the issue with a proposed fix:&nbsp;</div>
<div>&nbsp;&nbsp;<a href="https://github.com/AtlasOfLivingAustralia/ala-name-matching/issues/4" target="_blank">https://github.com/AtlasOfLivingAustralia/ala-name-matching/issues/4</a>&nbsp;</div>
<div><br>
</div>
<div>What it fails on though is that it is getting NULL names. &nbsp;Perhaps you can modify your input checklist to not have null names ever?</div>
<div><br>
</div>
<div>You might for example use this kind of SQL or similar for whatever you are using to generate the names list:</div>
<div><br>
</div>
<div>SELECT</div>
<div>&nbsp; kingdom, phylum, class, order, family, genus,&nbsp;</div>
<div>&nbsp; &nbsp; COALESCE (name, genus, family, order, class, phylum, kingdom) AS scientificName</div>
<div>FROM ...</div>
<div><br>
</div>
<div>The COALESCE function will then set the name to be the first non NULL value.</div>
<div><br>
</div>
<div>I tried to build the project the fix myself, but “mvn:assembly:single” did not produce me a fat jar, and the project read me doesn’t tell me how they did it… sorry.</div>
<div><br>
</div>
<div>I hope this helps,</div>
<div>Tim</div>
<div><br>
</div>
<div><br>
</div>
<div><br>
<div>
<div>On 04 Sep 2014, at 14:50, Santiago Martinez de la Riva &lt;<a href="mailto:sama@gbif.es" target="_blank">sama@gbif.es</a>&gt; wrote:</div>
<br class="Apple-interchange-newline">
<blockquote type="cite">Hi all,<br>
<br>
<br>
I'm trying to create our own name index. I'm following the steps of the wiki in GitHub:
<a href="https://github.com/AtlasOfLivingAustralia/documentation/wiki/Creating-a-name-index" target="_blank">
https://github.com/AtlasOfLivingAustralia/documentation/wiki/Creating-a-name-index</a><br>
<br>
Our dwca has the same estructura that dwca-col-mammals, but the problem is that when I try to generate the name index with the command: sudo nameindexer -dwca /...<br>
<br>
I get the next exception:<br>
<br>
vagrant@ala:/data/lucene/sources/dwca-spe2000-plantae$ sudo nameindexer -dwca /data/lucene/sources/dwca-spe2000-plantae<br>
2014-09-04 12:04:26,093 INFO : [DwcaNameIndexer] - Generating loading index: true<br>
2014-09-04 12:04:26,094 INFO : [DwcaNameIndexer] - Generating searching index: true<br>
2014-09-04 12:04:26,094 INFO : [DwcaNameIndexer] - Using the &nbsp;DwCA name file: /data/lucene/sources/dwca-spe2000-plantae<br>
2014-09-04 12:04:26,094 INFO : [DwcaNameIndexer] - Using the default IRMNG name file: /data/lucene/sources/IRMNG_DWC_HOMONYMS<br>
2014-09-04 12:04:26,095 INFO : [DwcaNameIndexer] - Using the default common name file: /data/lucene/sources/col_vernacular.txt<br>
2014-09-04 12:04:26,182 INFO : [DwcaNameIndexer] - Starting to create the temporary loading index.<br>
2014-09-04 12:08:10,283 INFO : [DwcaNameIndexer] - Finished creating the temporary load index with 1070805 concepts<br>
java.lang.NullPointerException<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;at au.org.ala.names.search.ALANameIndexer.isBlacklisted(ALANameIndexer.java:778)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;at au.org.ala.names.search.ALANameIndexer.createALAIndexDocument(ALANameIndexer.java:788)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;at au.org.ala.names.search.ALANameIndexer.createALAIndexDocument(ALANameIndexer.java:757)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;at au.org.ala.names.search.DwcaNameIndexer.addIndex(DwcaNameIndexer.java:350)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;at au.org.ala.names.search.DwcaNameIndexer.generateIndex(DwcaNameIndexer.java:281)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;at au.org.ala.names.search.DwcaNameIndexer.create(DwcaNameIndexer.java:101)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;at au.org.ala.names.search.DwcaNameIndexer.main(DwcaNameIndexer.java:527)<br>
<br>
And when I try to search some name, I get this other one expection:<br>
<br>
vagrant@ala:/data/lucene$ sudo nameindexer -testSearch &quot;Nepeta Catarea&quot;<br>
Search for name<br>
org.apache.lucene.index.IndexNotFoundException: no segments* file found in org.apache.lucene.store.NIOFSDirectory@/data/lucene/namematching/cb lockFactory=org.apache.lucene.store.NativeFSLockFactory@c22530: files: [write.lock]<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;at org.apache.lucene.index.SegmentInfos$FindSegmentsFile.run(SegmentInfos.java:741)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;at org.apache.lucene.index.StandardDirectoryReader.open(StandardDirectoryReader.java:52)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;at org.apache.lucene.index.DirectoryReader.open(DirectoryReader.java:65)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;at au.org.ala.names.search.ALANameSearcher.&lt;init&gt;(ALANameSearcher.java:122)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;at au.org.ala.names.search.DwcaNameIndexer.main(DwcaNameIndexer.java:465)<br>
<br>
<br>
Because the nameindexer didn't generate the necessary files:<br>
<br>
Help meee!! xD<br>
<br>
Cheers,<br>
SaMa<br>
<br>
<br>
---------------------------------------------------------------------------------------<br>
Santiago Martínez de la Riva<br>
GBIF.ES, Unidad de Coordinación &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Tel. &#43;34 91 4203017 x 273<br>
Real Jardín Botánico - CSIC &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Fax &#43;34 91 429 2405<br>
Plaza de Murillo, 2 &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<a href="mailto:sama@gbif.es" target="_blank">sama@gbif.es</a><br>
28014 Madrid, Spain &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://www.gbif.es" target="_blank">www.gbif.es</a><br>
_______________________________________________<br>
Ala-portal mailing list<br>
<a href="mailto:Ala-portal@lists.gbif.org" target="_blank">Ala-portal@lists.gbif.org</a><br>
http://lists.gbif.org/mailman/listinfo/ala-portal<br>
<br>
</blockquote>
</div>
<br>
</div>
</div>
</div>
</div>
</div>
</body>
</html>