<html>
  <head>
    <meta content="text/html; charset=windows-1252"
      http-equiv="Content-Type">
  </head>
  <body bgcolor="#FFFFFF" text="#000000">
    <p>Hi,</p>
    <p>Adding to what Markus says:</p>
    <p>Many (perhaps most, or even almost all) duplicate IPNI records
      have been linked in IPNI, so 391732-1 is indeed the correct one.
      This work is more recent than the 2009 export to GBIF, so GBIF
      still has the duplicates.  The IPNI website displays the links,
      but unfortunately doesn't show it in the RDF format.<br>
    </p>
    <p>You can run 2 million queries against our API, this should not be
      a problem.  When we are crawling large datasets, we average around
      500 requests/second to the species API.  Try using several
      parallel connections, if it's too slow otherwise.<br>
    </p>
    <p>Cheers,</p>
    <p>Matt<br>
    </p>
    <p>On 22/02/17 12:14, Markus Döring wrote:<br>
    </p>
    <blockquote cite="mid:C1178A4A-C4B3-43BD-99E3-F99E891F46F4@gbif.org"
      type="cite">
      <meta http-equiv="Content-Type" content="text/html;
        charset=windows-1252">
      Hi Yan,
      <div class=""><br class="">
      </div>
      <div class="">the way you describe is the current way to go. </div>
      <div class="">IPNI unfortunately has 2 problems you should be
        aware of. The dataset in GBIF is a somewhat outdated and has not
        been updated since 2009. We are working with Kew to publish a
        new version for a long time, but things progress very slowly.</div>
      <div class=""><br class="">
      </div>
      <div class="">The other issue is that IPNI really is 3 datasets
        combined all of which can cover the same name. You should
        therefore be prepared to find multiple ids for the same name -
        even on their current website. See <a moz-do-not-send="true"
          href="http://www.ipni.org/about_the_index.html" class="">http://www.ipni.org/about_the_index.html</a></div>
      <div class=""><br class="">
      </div>
      <div class="">For example Avena sativa gives 3 hits from IK, GCI
        & APNI: <a moz-do-not-send="true"
href="http://www.ipni.org/ipni/simplePlantNameSearch.do?find_wholeName=Avena+sativa&output_format=normal&query_type=by_query&back_page=query_ipni.html"
          class="">http://www.ipni.org/ipni/simplePlantNameSearch.do?find_wholeName=Avena+sativa&output_format=normal&query_type=by_query&back_page=query_ipni.html</a></div>
      <div class=""><br class="">
      </div>
      <div class="">In the future we would like to add a
        scientificNameID property to the GBIF backbone taxa and populate
        that with IPNI, IF or ZooBank ids. But that is not available so
        far.</div>
      <div class=""><br class="">
      </div>
      <div class="">Best,</div>
      <div class="">Markus</div>
      <div class=""><br class="">
        <div>
          <blockquote type="cite" class="">
            <div class="">On 22 Feb 2017, at 12:03, Yan Wong <<a
                moz-do-not-send="true" href="mailto:yan@pixie.org.uk"
                class="">yan@pixie.org.uk</a>> wrote:</div>
            <br class="Apple-interchange-newline">
            <div class="">
              <div class="">Hi<br class="">
                <br class="">
                I have a large number of GBIF ids (~ 2 million), for
                which I wish to know any existing International Plant
                Names Index IDs (IPNI s). What’s the easiest way to do
                this? I can use the standard API, e.g.
                <br class="">
                <br class="">
                <a moz-do-not-send="true"
                  href="http://api.gbif.org/v1/species/2705290/related"
                  class="">http://api.gbif.org/v1/species/2705290/related</a><br
                  class="">
                <br class="">
                for 2705290 = Avena sativa, which gives me an output
                that contains several IPNIs (in this case, 164949-3,
                391732-1, 27200-2, of which the number 391732-1 seems to
                be the canonical one, although I can’t figure out how to
                identify it as such from the GBIF API output)<br
                  class="">
                <br class="">
                It will obviously be tedious (and unwarranted) to make 2
                million API calls. What’s the recommended way to do
                this?<br class="">
                <br class="">
                Yan<br class="">
                _______________________________________________<br
                  class="">
                API-users mailing list<br class="">
                <a class="moz-txt-link-abbreviated" href="mailto:API-users@lists.gbif.org">API-users@lists.gbif.org</a><br class="">
                <a class="moz-txt-link-freetext" href="http://lists.gbif.org/mailman/listinfo/api-users">http://lists.gbif.org/mailman/listinfo/api-users</a><br
                  class="">
              </div>
            </div>
          </blockquote>
        </div>
        <br class="">
      </div>
      <br>
      <fieldset class="mimeAttachmentHeader"></fieldset>
      <br>
      <pre wrap="">_______________________________________________
API-users mailing list
<a class="moz-txt-link-abbreviated" href="mailto:API-users@lists.gbif.org">API-users@lists.gbif.org</a>
<a class="moz-txt-link-freetext" href="http://lists.gbif.org/mailman/listinfo/api-users">http://lists.gbif.org/mailman/listinfo/api-users</a>
</pre>
    </blockquote>
    <br>
  </body>
</html>