<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40"><head><meta http-equiv=Content-Type content="text/html; charset=utf-8"><meta name=Generator content="Microsoft Word 14 (filtered medium)"><style><!--
/* Font Definitions */
@font-face
        {font-family:Helvetica;
        panose-1:2 11 6 4 2 2 2 2 2 4;}
@font-face
        {font-family:Helvetica;
        panose-1:2 11 6 4 2 2 2 2 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;
        font-family:"Calibri","sans-serif";}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]--></head><body lang=EN-US link=blue vlink=purple><div class=WordSection1><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Hi Scott,<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>I’m sure that someone with more direct knowledge of the GBIF taxonomy backbone will answer more specifically.  But in general, essentially all large taxonomic databases have these sorts of duplicate records due to spelling variations, etc.  Most such databases began by harvesting lists of (messy) text-string names from various sources, with the early emphasis being on quantity rather than quality.  In recent years, the emphasis has shifted towards improving quality, and to greater or lesser degrees, most large databases and aggregators have made tremendous progress in reconciling and correcting these sorts of issues.  However, these kind of lexical variants (i.e., two slightly different spellings being mistakenly represented as separate names) continue to exist, and probably will continue for quite some time (especially in large taxonomic aggregators, such as GIBIF).  The Global Names Architecture has current NSF funding (PI: Dima Mozzherin) to develop tools to help reconcile these sorts of lexical variants, and we have another NSF grant pending that will flesh those cleaned/reconciled text-string names out into metadata-rich names and name-usages… so there is some additional hope of accelerated clean-up in the next few years.  But until then, I’m afraid these kinds of duplicates will continued to be discovered and addressed on a case-by-case basis.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Not sure if that helps…. But if you do restrict to a single source (like CoL), you’re less likely to encounter these kinds of duplicates, and the presumption is that linking to either one will eventually get straightened out.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Aloha,<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Rich<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Richard L. Pyle, PhD<br>Database Coordinator for Natural Sciences | Associate Zoologist in Ichthyology | Dive Safety Officer<br>Department of Natural Sciences, Bishop Museum, 1525 Bernice St., Honolulu, HI 96817<br>Ph: (808)848-4115, Fax: (808)847-8252 email: deepreef@bishopmuseum.org<br><a href="http://hbs.bishopmuseum.org/staff/pylerichard.html">http://hbs.bishopmuseum.org/staff/pylerichard.html</a><o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><div style='border:none;border-left:solid blue 1.5pt;padding:0in 0in 0in 4.0pt'><div><div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in'><p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>From:</span></b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'> API-users [mailto:api-users-bounces@lists.gbif.org] <b>On Behalf Of </b>Scott Chamberlain<br><b>Sent:</b> Wednesday, May 11, 2016 11:23 AM<br><b>To:</b> api-users@lists.gbif.org<br><b>Cc:</b> juli g. pausas<br><b>Subject:</b> [API-users] Scientific names questions<o:p></o:p></span></p></div></div><p class=MsoNormal><o:p> </o:p></p><div><p class=MsoNormal>HI all, <o:p></o:p></p><div><p class=MsoNormal><o:p> </o:p></p></div><div><p class=MsoNormal>Not sure where is best to ask this... so here goes. Let me know if there's a better place.  <o:p></o:p></p></div><div><p class=MsoNormal><o:p> </o:p></p></div><div><p class=MsoNormal>The following are examples some users have highlighted for me as leading to confusion when searching for taxa.<o:p></o:p></p></div><div><div><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Helvetica","sans-serif";color:#212121'><o:p> </o:p></span></p></div><div><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Helvetica","sans-serif";color:#212121'>1. Macrozamia platyrachis (</span><a href="http://www.gbif.org/species/4928834"><span style='font-family:"Helvetica","sans-serif"'>http://www.gbif.org/species/4928834</span></a><span style='font-size:10.0pt;font-family:"Helvetica","sans-serif";color:#212121'>) vs. Macrozamia platyrhachis (</span><a href="http://www.gbif.org/species/2683551"><span style='font-family:"Helvetica","sans-serif"'>http://www.gbif.org/species/2683551</span></a><span style='font-size:10.0pt;font-family:"Helvetica","sans-serif";color:#212121'>)<o:p></o:p></span></p></div><div><p class=MsoNormal><o:p> </o:p></p></div><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Helvetica","sans-serif";color:#212121'>Here, the two spellings (with/without h) are accepted, and exact matches. The sci. authority seems to differ with </span><span style='font-family:"Helvetica","sans-serif";color:#212121'>F. M. Bailey vs. F.M.Bailey. The first is from GRIN taxonomy and the second from COL. </span><o:p></o:p></p></div><div><p class=MsoNormal><o:p> </o:p></p></div><div><p class=MsoNormal><span style='font-family:"Helvetica","sans-serif";color:#212121'>Anyway, for users e.g., of the R client, this is a bit confusing. I had thought the backbone taxonomy would only have one master taxon key and name for each real taxon, but here it seems like there's two?</span><o:p></o:p></p></div><div><p class=MsoNormal><o:p> </o:p></p></div><div><p class=MsoNormal><span style='font-family:"Helvetica","sans-serif";color:#212121'>2. Cycas circinalis (</span><a href="http://www.gbif.org/species/2683264"><span style='font-family:"Helvetica","sans-serif"'>http://www.gbif.org/species/2683264</span></a><span style='font-family:"Helvetica","sans-serif";color:#212121'> </span><span style='font-size:10.0pt;font-family:"Helvetica","sans-serif";color:#212121'>) vs. </span><span style='font-family:"Helvetica","sans-serif";color:#212121'>Cycas circinnalis (</span><a href="http://www.gbif.org/species/3594916"><span style='font-family:"Helvetica","sans-serif"'>http://www.gbif.org/species/3594916</span></a><span style='font-family:"Helvetica","sans-serif";color:#212121'> )</span><o:p></o:p></p></div><div><div><p class=MsoNormal><br><span style='font-size:10.0pt;font-family:"Helvetica","sans-serif";color:#212121'>Here, the two spellings (with 1 or 2 "n"'s) are accepted, and exact matches. The sci. authorities here are exactly the same.</span><span style='font-family:"Helvetica","sans-serif";color:#212121'> The first is from COL and the second from IPNI taxonomy. </span><o:p></o:p></p></div><div><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Helvetica","sans-serif";color:#212121'><o:p> </o:p></span></p></div><div><p class=MsoNormal><span style='font-family:"Helvetica","sans-serif";color:#212121'>3. Isolona perrieri (</span><a href="http://www.gbif.org/species/3648546"><span style='font-family:"Helvetica","sans-serif"'>http://www.gbif.org/species/3648546</span></a><span style='font-family:"Helvetica","sans-serif";color:#212121'> ) vs Isolona perrierii (</span><a href="http://www.gbif.org/species/6308376"><span style='font-family:"Helvetica","sans-serif"'>http://www.gbif.org/species/6308376</span></a><span style='font-family:"Helvetica","sans-serif";color:#212121'> )</span><o:p></o:p></p></div><div><div><p class=MsoNormal><br><span style='font-size:10.0pt;font-family:"Helvetica","sans-serif";color:#212121'>Here, the two spellings (with 1 or 2 "i"'s) are accepted, and exact matches. The sci. authorities here are exactly the same.</span><span style='font-family:"Helvetica","sans-serif";color:#212121'> The first is from TPL and the second from COL </span><o:p></o:p></p></div></div><div><p class=MsoNormal><o:p> </o:p></p></div><div><p class=MsoNormal><span style='font-family:"Helvetica","sans-serif";color:#212121'>--------</span><o:p></o:p></p></div><div><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Helvetica","sans-serif";color:#212121'><o:p> </o:p></span></p></div><div><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Helvetica","sans-serif";color:#212121'>Should I advise users to when searching on the backbone taxonomy to limit to COL to avoid any confusion about names?  <o:p></o:p></span></p></div></div><div><p class=MsoNormal><o:p> </o:p></p></div><div><p class=MsoNormal>Best, <o:p></o:p></p></div><div><p class=MsoNormal>Scott Chamberlain<o:p></o:p></p></div></div></div></div></body></html>