<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
</head>
<body dir="auto">
<div>Thanks Tim,</div>
<div><br>
</div>
<div>Specific example I'm working on is DNA barcoding data from BOLD. Their data dumps and web API differ in how they identify same record (basically whether they include the suffix '.COI-5P' or not) which is deeply annoying. So I may have a case where I need
 to update ids for large number of records, and want the other version of those records to be replaced. Sounds like I would need to ask you specifically to delete old ones if I want to this to happen. </div>
<div><br>
</div>
<div>Regards,</div>
<div><br>
</div>
<div>Rod<br>
<br>
<div class="acompli_signature">Get <a href="https://aka.ms/o0ukef">Outlook for iOS</a></div>
<br>
</div>
<br>
<br>
<br>
<div class="gmail_quote">On Sat, Aug 27, 2016 at 7:12 AM +0100, "Tim Robertson" <span dir="ltr">
<<a href="mailto:trobertson@gbif.org" target="_blank">trobertson@gbif.org</a>></span> wrote:<br>
<br>
</div>
<div>
<div>Hi Rod</div>
<div id="AppleMailSignature"><br>
</div>
<div id="AppleMailSignature">It is not done automatically due to the fact it normally happens due to some mapping error rather than by design.</div>
<div id="AppleMailSignature"><br>
</div>
<div id="AppleMailSignature">Today we trigger it manually, but do want to automate it - probably only for cases it seems genuine. </div>
<div id="AppleMailSignature"><br>
</div>
<div id="AppleMailSignature">Cheers,<br>
<div>Tim</div>
</div>
<div><br>
On 27 Aug 2016, at 08:01, Roderic Page <<a href="mailto:Roderic.Page@glasgow.ac.uk">Roderic.Page@glasgow.ac.uk</a>> wrote:<br>
<br>
</div>
<blockquote type="cite">
<div>
<div>Just wanted to check the consequences of the following dataset operation.</div>
<div><br>
</div>
<div>Say I have a dataset with 10 occurrences with occurrence ids 1-10. In my local database I now assign those 10 occurrences new identifiers a-j. If I create a new DwCA file for my data and crawl the new archive, my expectation is:</div>
<div><br>
</div>
<div>1. Old data with ids 1-10 is deleted from GBIF index </div>
<div>2. New data with ids a-j is indexed</div>
<div><br>
</div>
<div>So, end result is dataset has 10 occurrences. I'm asking because I know in the past the some datasets have changed identifiers and this has resulted in records with old and new identifiers coexisting in GBIF index, resulting in duplicated data.</div>
<div><br>
</div>
<div>Obviously it would be nice to have stable, unchanging identifiers for occurrences, but the for data set I'm working with the creators have changed their minds between versions of the data :(</div>
<div><br>
</div>
<div>Regards,</div>
<div><br>
</div>
<div>Rod<br>
<br>
<div class="acompli_signature">Get <a href="https://aka.ms/o0ukef">Outlook for iOS</a></div>
<br>
</div>
</div>
</blockquote>
<blockquote type="cite">
<div><span>_______________________________________________</span><br>
<span>API-users mailing list</span><br>
<span><a href="mailto:API-users@lists.gbif.org">API-users@lists.gbif.org</a></span><br>
<span><a href="http://lists.gbif.org/mailman/listinfo/api-users">http://lists.gbif.org/mailman/listinfo/api-users</a></span><br>
</div>
</blockquote>
</div>
</body>
</html>