<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
Hi Scott,
<div class=""><br class="">
</div>
<div class="">these are indeed unwanted duplications of species in our backbone. The software that builds the backbone so far does not yet try to synonymize these spelling variations automatically as it is quite easy to get that wrong. We will work on this
 in an improved version of the algorithm, the open issue is here:</div>
<div class=""><a href="http://dev.gbif.org/issues/browse/POR-2812" class="">http://dev.gbif.org/issues/browse/POR-2812</a></div>
<div class=""><br class="">
</div>
<div class="">… which is part of the next round of improving the backbone building:</div>
<div class=""><a href="http://dev.gbif.org/issues/browse/POR-3029" class="">http://dev.gbif.org/issues/browse/POR-3029</a></div>
<div class=""><br class="">
</div>
<div class=""><br class="">
</div>
<div class="">Until then please let us know about those duplicate names. It helps understanding the problem better and as a last resort we could add those names to our patch list as known spelling variations, i.e. synonyms. They then get synonymized in future
 backbone versions:</div>
<div class=""><a href="https://github.com/gbif/backbone-patch" class="">https://github.com/gbif/backbone-patch</a></div>
<div class=""><br class="">
</div>
<div class=""><br class="">
</div>
<div class="">Many thanks,</div>
<div class="">Markus</div>
<div class=""><br class="">
</div>
<div class=""><br class="">
</div>
<div class=""><br class="">
<div>
<blockquote type="cite" class="">
<div class="">On 11 May 2016, at 23:22, Scott Chamberlain <<a href="mailto:myrmecocystus@gmail.com" class="">myrmecocystus@gmail.com</a>> wrote:</div>
<br class="Apple-interchange-newline">
<div class="">
<div dir="ltr" class="">HI all, 
<div class=""><br class="">
</div>
<div class="">Not sure where is best to ask this... so here goes. Let me know if there's a better place.  </div>
<div class=""><br class="">
</div>
<div class="">The following are examples some users have highlighted for me as leading to confusion when searching for taxa.</div>
<div class="">
<div style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;font-size:13px" class="">
<br class="">
</div>
<div style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;font-size:13px" class="">
1. Macrozamia platyrachis (<a href="http://www.gbif.org/species/4928834" style="line-height:1.5;font-size:small" class="">http://www.gbif.org/species/4928834</a><span style="line-height:1.5" class="">) vs. Macrozamia platyrhachis (</span><a href="http://www.gbif.org/species/2683551" style="line-height:1.5;font-size:small" class="">http://www.gbif.org/species/2683551</a>)</div>
<div class=""><br class="">
</div>
<span style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;font-size:13px" class="">Here, the two spellings (with/without h) are accepted, and exact matches. The sci. authority seems to differ with </span><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif" class="">F.
 M. Bailey vs. F.M.Bailey. The first is from GRIN taxonomy and the second from COL. </font></div>
<div class=""><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif" class=""><br class="">
</font></div>
<div class=""><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif" class="">Anyway, for users e.g., of the R client, this is a bit confusing. I had thought the backbone taxonomy would only have one master taxon key and name for each real
 taxon, but here it seems like there's two?</font></div>
<div class=""><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif" class=""><br class="">
</font></div>
<div class=""><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif" class="">2. Cycas circinalis<span style="line-height:1.5" class=""> (</span></font><span style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;line-height:1.5" class=""><a href="http://www.gbif.org/species/2683264" class="">http://www.gbif.org/species/2683264</a> </span><span style="line-height:1.5;font-size:13px;color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif" class="">)</span><span style="line-height:1.5;font-size:13px;color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif" class=""> vs. </span><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif" class="">Cycas
 circinnalis (<a href="http://www.gbif.org/species/3594916" class="">http://www.gbif.org/species/3594916</a> </font><span style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;line-height:1.5" class="">)</span></div>
<div class="">
<div class=""><br class="">
<span style="font-size:13px;color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif" class="">Here, the two spellings (with 1 or 2 "n"'s) are accepted, and exact matches. The sci. authorities here are exactly the same.</span><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif" class=""> The
 first is from COL and the second from IPNI taxonomy. </font><br class="">
</div>
<div style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;font-size:13px" class="">
<br class="">
</div>
<div class=""><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif" class="">3. Isolona perrieri (<a href="http://www.gbif.org/species/3648546" class="">http://www.gbif.org/species/3648546</a> </font><span style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;line-height:1.5" class="">)
 vs Isolona perrierii (</span><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif" class=""><a href="http://www.gbif.org/species/6308376" class="">http://www.gbif.org/species/6308376</a> </font><span style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;line-height:1.5" class="">)</span></div>
<div class="">
<div class=""><br class="">
<span style="font-size:13px;color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif" class="">Here, the two spellings (with 1 or 2 "i"'s) are accepted, and exact matches. The sci. authorities here are exactly the same.</span><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif" class=""> The
 first is from TPL and the second from COL </font></div>
</div>
<div class=""><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif" class=""><br class="">
</font></div>
<div class=""><font color="#212121" face="helvetica neue, helvetica, arial, sans-serif" class="">--------</font></div>
<div style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;font-size:13px" class="">
<br class="">
</div>
<div style="color:rgb(33,33,33);font-family:'helvetica neue',helvetica,arial,sans-serif;font-size:13px" class="">
Should I advise users to when searching on the backbone taxonomy to limit to COL to avoid any confusion about names?  </div>
</div>
<div class=""><br class="">
</div>
<div class="">Best, <br class="">
</div>
<div class="">Scott Chamberlain<br class="">
</div>
</div>
_______________________________________________<br class="">
API-users mailing list<br class="">
<a href="mailto:API-users@lists.gbif.org" class="">API-users@lists.gbif.org</a><br class="">
http://lists.gbif.org/mailman/listinfo/api-users<br class="">
</div>
</blockquote>
</div>
<br class="">
</div>
</body>
</html>