<div dir="ltr">Richard, <br><br>Thanks for the response! All makes sense. I'll work on making sure my users are aware of these issues and give them options according to their use case. <br><div><br></div><div>--- <br><br>Markus, </div><div><br></div><div><br>Thanks, I'll follow those issues. </div><div><br></div><div>> <span style="font-family:'helvetica neue',helvetica,arial,sans-serif">please let us know about those duplicate names.</span></div><div><font face="helvetica neue, helvetica, arial, sans-serif"><br></font></div><div><font face="helvetica neue, helvetica, arial, sans-serif">Where? in JIRA, or a github repo issues?<br></font><br>Best, Scott</div></div><br><div class="gmail_quote"><div dir="ltr">On Thu, May 12, 2016 at 2:13 AM Markus Döring <<a href="mailto:mdoering@gbif.org">mdoering@gbif.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">



<div style="word-wrap:break-word">
Hi Scott,
<div><br>
</div>
<div>these are indeed unwanted duplications of species in our backbone. The software that builds the backbone so far does not yet try to synonymize these spelling variations automatically as it is quite easy to get that wrong. We will work on this
 in an improved version of the algorithm, the open issue is here:</div>
<div><a href="http://dev.gbif.org/issues/browse/POR-2812" target="_blank">http://dev.gbif.org/issues/browse/POR-2812</a></div>
<div><br>
</div>
<div>… which is part of the next round of improving the backbone building:</div>
<div><a href="http://dev.gbif.org/issues/browse/POR-3029" target="_blank">http://dev.gbif.org/issues/browse/POR-3029</a></div>
<div><br>
</div>
<div><br>
</div>
<div>Until then please let us know about those duplicate names. It helps understanding the problem better and as a last resort we could add those names to our patch list as known spelling variations, i.e. synonyms. They then get synonymized in future
 backbone versions:</div>
<div><a href="https://github.com/gbif/backbone-patch" target="_blank">https://github.com/gbif/backbone-patch</a></div>
<div><br>
</div>
<div><br>
</div>
<div>Many thanks,</div>
<div>Markus</div>
<div><br>
</div>
<div><br>
</div>
<div><br>
<div>
<blockquote type="cite"></blockquote></div></div></div><div style="word-wrap:break-word"><div><div><blockquote type="cite">
<div>On 11 May 2016, at 23:22, Scott Chamberlain <<a href="mailto:myrmecocystus@gmail.com" target="_blank">myrmecocystus@gmail.com</a>> wrote:</div>
<br>
</blockquote></div></div></div><div style="word-wrap:break-word"><div><div><blockquote type="cite"><div>
<div dir="ltr">HI all, 
<div><br>
</div>
<div>Not sure where is best to ask this... so here goes. Let me know if there's a better place.  </div>
<div><br>
</div>
<div>The following are examples some users have highlighted for me as leading to confusion when searching for taxa.</div>
<div>
<div style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;font-size:13px">
<br>
</div>
<div style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;font-size:13px">
1. Macrozamia platyrachis (<a href="http://www.gbif.org/species/4928834" style="line-height:1.5;font-size:small" target="_blank">http://www.gbif.org/species/4928834</a><span style="line-height:1.5">) vs. Macrozamia platyrhachis (</span><a href="http://www.gbif.org/species/2683551" style="line-height:1.5;font-size:small" target="_blank">http://www.gbif.org/species/2683551</a>)</div>
<div><br>
</div>
<span style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;font-size:13px">Here, the two spellings (with/without h) are accepted, and exact matches. The sci. authority seems to differ with </span><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif">F.
 M. Bailey vs. F.M.Bailey. The first is from GRIN taxonomy and the second from COL. </font></div>
<div><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif"><br>
</font></div>
<div><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif">Anyway, for users e.g., of the R client, this is a bit confusing. I had thought the backbone taxonomy would only have one master taxon key and name for each real
 taxon, but here it seems like there's two?</font></div>
<div><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif"><br>
</font></div>
<div><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif">2. Cycas circinalis<span style="line-height:1.5"> (</span></font><span style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;line-height:1.5"><a href="http://www.gbif.org/species/2683264" target="_blank">http://www.gbif.org/species/2683264</a> </span><span style="line-height:1.5;font-size:13px;color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif">)</span><span style="line-height:1.5;font-size:13px;color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif"> vs. </span><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif">Cycas
 circinnalis (<a href="http://www.gbif.org/species/3594916" target="_blank">http://www.gbif.org/species/3594916</a> </font><span style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;line-height:1.5">)</span></div>
<div>
<div><br>
<span style="font-size:13px;color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif">Here, the two spellings (with 1 or 2 "n"'s) are accepted, and exact matches. The sci. authorities here are exactly the same.</span><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif"> The
 first is from COL and the second from IPNI taxonomy. </font><br>
</div>
<div style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;font-size:13px">
<br>
</div>
<div><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif">3. Isolona perrieri (<a href="http://www.gbif.org/species/3648546" target="_blank">http://www.gbif.org/species/3648546</a> </font><span style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;line-height:1.5">)
 vs Isolona perrierii (</span><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif"><a href="http://www.gbif.org/species/6308376" target="_blank">http://www.gbif.org/species/6308376</a> </font><span style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;line-height:1.5">)</span></div>
<div>
<div><br>
<span style="font-size:13px;color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif">Here, the two spellings (with 1 or 2 "i"'s) are accepted, and exact matches. The sci. authorities here are exactly the same.</span><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif"> The
 first is from TPL and the second from COL </font></div>
</div>
<div><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif"><br>
</font></div>
<div><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif">--------</font></div>
<div style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;font-size:13px">
<br>
</div>
<div style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;font-size:13px">
Should I advise users to when searching on the backbone taxonomy to limit to COL to avoid any confusion about names?  </div>
</div>
<div><br>
</div>
<div>Best, <br>
</div>
<div>Scott Chamberlain<br>
</div>
</div></div></blockquote></div></div></div><div style="word-wrap:break-word"><div><div><blockquote type="cite"><div>
_______________________________________________<br>
API-users mailing list<br>
<a href="mailto:API-users@lists.gbif.org" target="_blank">API-users@lists.gbif.org</a><br>
<a href="http://lists.gbif.org/mailman/listinfo/api-users" target="_blank">http://lists.gbif.org/mailman/listinfo/api-users</a><br>
</div>
</blockquote>
</div>
<br>
</div>
</div>

</blockquote></div>