<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
OK, I’ll do that. Many thanks!
<div class=""><br class="">
</div>
<div class="">Regards,</div>
<div class=""><br class="">
</div>
<div class="">Rod</div>
<div class=""><br class="">
</div>
<div class=""><br class="">
<div>
<blockquote type="cite" class="">
<div class="">On 27 Aug 2016, at 08:17, Tim Robertson <<a href="mailto:trobertson@gbif.org" class="">trobertson@gbif.org</a>> wrote:</div>
<br class="Apple-interchange-newline">
<div class="">
<div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; font-size: 14px; font-family: Calibri, sans-serif;" class="">
<div class="">The easiest approach is actually for us to delete all records before indexing the new version.</div>
<div class="">Just before you are ready for it to be reindexed, if you let us know it’s a trivial thing to do and would be complete in around 1hr.</div>
<div class=""><br class="">
</div>
<div class="">Thanks,</div>
<div class="">Tim</div>
<div class=""><br class="">
</div>
<div class=""><br class="">
</div>
<span id="OLK_SRC_BODY_SECTION" class="">
<div style="font-family: Calibri; font-size: 11pt; text-align: left; border-width: 1pt medium medium; border-style: solid none none; padding: 3pt 0in 0in; border-top-color: rgb(181, 196, 223);" class="">
<span style="font-weight:bold" class="">From: </span>Roderic Page <<a href="mailto:Roderic.Page@glasgow.ac.uk" class="">Roderic.Page@glasgow.ac.uk</a>><br class="">
<span style="font-weight:bold" class="">Date: </span>Saturday 27 August 2016 at 08:18<br class="">
<span style="font-weight:bold" class="">To: </span>Tim Robertson <<a href="mailto:trobertson@gbif.org" class="">trobertson@gbif.org</a>><br class="">
<span style="font-weight:bold" class="">Cc: </span>"<a href="mailto:api-users@lists.gbif.org" class="">api-users@lists.gbif.org</a>" <<a href="mailto:api-users@lists.gbif.org" class="">api-users@lists.gbif.org</a>><br class="">
<span style="font-weight:bold" class="">Subject: </span>Re: [API-users] What happens to previous data after dataset/crawl?<br class="">
</div>
<div class=""><br class="">
</div>
<div class="">
<div dir="auto" class="">
<div class="">Thanks Tim,</div>
<div class=""><br class="">
</div>
<div class="">Specific example I'm working on is DNA barcoding data from BOLD. Their data dumps and web API differ in how they identify same record (basically whether they include the suffix '.COI-5P' or not) which is deeply annoying. So I may have a case where
 I need to update ids for large number of records, and want the other version of those records to be replaced. Sounds like I would need to ask you specifically to delete old ones if I want to this to happen. </div>
<div class=""><br class="">
</div>
<div class="">Regards,</div>
<div class=""><br class="">
</div>
<div class="">Rod<br class="">
<br class="">
<div class="acompli_signature">Get <a href="https://aka.ms/o0ukef" class="">Outlook for iOS</a></div>
<br class="">
</div>
<br class="">
<br class="">
<br class="">
<div class="gmail_quote">On Sat, Aug 27, 2016 at 7:12 AM +0100, "Tim Robertson" <span dir="ltr" class="">
<<a href="mailto:trobertson@gbif.org" target="_blank" class="">trobertson@gbif.org</a>></span> wrote:<br class="">
<br class="">
</div>
<div class="">
<div class="">Hi Rod</div>
<div class=""><br class="">
</div>
<div class="">It is not done automatically due to the fact it normally happens due to some mapping error rather than by design.</div>
<div class=""><br class="">
</div>
<div class="">Today we trigger it manually, but do want to automate it - probably only for cases it seems genuine. </div>
<div class=""><br class="">
</div>
<div class="">Cheers,<br class="">
<div class="">Tim</div>
</div>
<div class=""><br class="">
On 27 Aug 2016, at 08:01, Roderic Page <<a href="mailto:Roderic.Page@glasgow.ac.uk" class="">Roderic.Page@glasgow.ac.uk</a>> wrote:<br class="">
<br class="">
</div>
<blockquote type="cite" class="">
<div class="">
<div class="">Just wanted to check the consequences of the following dataset operation.</div>
<div class=""><br class="">
</div>
<div class="">Say I have a dataset with 10 occurrences with occurrence ids 1-10. In my local database I now assign those 10 occurrences new identifiers a-j. If I create a new DwCA file for my data and crawl the new archive, my expectation is:</div>
<div class=""><br class="">
</div>
<div class="">1. Old data with ids 1-10 is deleted from GBIF index </div>
<div class="">2. New data with ids a-j is indexed</div>
<div class=""><br class="">
</div>
<div class="">So, end result is dataset has 10 occurrences. I'm asking because I know in the past the some datasets have changed identifiers and this has resulted in records with old and new identifiers coexisting in GBIF index, resulting in duplicated data.</div>
<div class=""><br class="">
</div>
<div class="">Obviously it would be nice to have stable, unchanging identifiers for occurrences, but the for data set I'm working with the creators have changed their minds between versions of the data :(</div>
<div class=""><br class="">
</div>
<div class="">Regards,</div>
<div class=""><br class="">
</div>
<div class="">Rod<br class="">
<br class="">
<div class="acompli_signature">Get <a href="https://aka.ms/o0ukef" class="">Outlook for iOS</a></div>
<br class="">
</div>
</div>
</blockquote>
<blockquote type="cite" class="">
<div class=""><span class="">_______________________________________________</span><br class="">
<span class="">API-users mailing list</span><br class="">
<span class=""><a href="mailto:API-users@lists.gbif.org" class="">API-users@lists.gbif.org</a></span><br class="">
<span class=""><a href="http://lists.gbif.org/mailman/listinfo/api-users" class="">http://lists.gbif.org/mailman/listinfo/api-users</a></span><br class="">
</div>
</blockquote>
</div>
</div>
</div>
</span></div>
</div>
</blockquote>
</div>
<br class="">
<div apple-content-edited="true" class="">
<div style="color: rgb(0, 0, 0); letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
<div style="color: rgb(0, 0, 0); letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
<div style="color: rgb(0, 0, 0); letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
<div style="color: rgb(0, 0, 0); letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
---------------------------------------------------------<br class="">
Roderic Page<br class="">
Professor of Taxonomy<br class="">
Institute of Biodiversity, Animal Health and Comparative Medicine<br class="">
College of Medical, Veterinary and Life Sciences<br class="">
Graham Kerr Building<br class="">
University of Glasgow<br class="">
Glasgow G12 8QQ, UK<br class="">
<br class="">
Email: <span class="Apple-tab-span" style="white-space: pre;"> </span><a href="mailto:Roderic.Page@glasgow.ac.uk" class="">Roderic.Page@glasgow.ac.uk</a><br class="">
Tel: <span class="Apple-tab-span" style="white-space: pre;"> </span>+44 141 330 4778<br class="">
Skype: <span class="Apple-tab-span" style="white-space: pre;"> </span>rdmpage<br class="">
Facebook: <span class="Apple-tab-span" style="white-space: pre;"> </span>http://www.facebook.com/rdmpage<br class="">
LinkedIn: <span class="Apple-tab-span" style="white-space: pre;"> </span>http://uk.linkedin.com/in/rdmpage<br class="">
Twitter: <span class="Apple-tab-span" style="white-space: pre;"> </span>http://twitter.com/rdmpage<br class="">
Blog: <span class="Apple-tab-span" style="white-space: pre;"> </span>http://iphylo.blogspot.com<br class="">
ORCID: <span class="Apple-tab-span" style="white-space: pre;"> </span>http://orcid.org/0000-0002-7101-9767</div>
<div style="color: rgb(0, 0, 0); letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
Citations: <span class="Apple-tab-span" style="white-space: pre;"> </span><a href="http://scholar.google.co.uk/citations?hl=en&user=4Z5WABAAAAAJ" class="">http://scholar.google.co.uk/citations?hl=en&user=4Z5WABAAAAAJ</a></div>
<div style="color: rgb(0, 0, 0); letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
ResearchGate<span class="Apple-tab-span" style="white-space: pre;"> </span><a href="https://www.researchgate.net/profile/Roderic_Page" class="">https://www.researchgate.net/profile/Roderic_Page</a><br class="">
<br class="">
</div>
</div>
</div>
</div>
</div>
<br class="">
</div>
</body>
</html>