<div dir="ltr"><div>Hi Matt,<input name="virtru-metadata" type="hidden" value="{"email-policy":{"state":"closed","expirationUnit":"days","disableCopyPaste":false,"disablePrint":false,"disableForwarding":false,"enableNoauth":false,"persistentProtection":false,"expandedWatermarking":false,"expires":false,"isManaged":false},"attachments":{},"compose-id":"22","compose-window":{"secure":false}}"></div><div><br></div><div>Yes, I did mean "multimedia.txt" and not "metadata.txt". Sorry for the confusion and thanks for seeing past it.</div><div><br></div><div>I am very happy to learn that extra records in the extension files (media etc) are ignored and that there are no plans to change that. I was hoping for this because of the way we package our DWC file. Our occurrence data comes from our "Specify" database and pulled into the IPT server via a connection. However our multimedia/images are pulled into our "Specify" database via a feed from a separate image-server/database and then this table of data is also read by the IPT server via a connection.</div><div><br></div><div>Under consideration is using this multimedia/image feed to populate a temporary Symbiota portal within which the occurrence data can be transcribed and entered. The occurrences will intentionally not be given a GUID since Symbiota is the source DB and rather is being used as a tool to prepare the data for import into our source DB which is "Specify".</div><div><br></div><div>Therefore I was being faced with a question of if we were to put extra images in the "multimedia.txt" that do not have corresponding occurrence IDs yet if that would cause incorrect processing by how GBIF handles the DWC extraction. Therefore, learning that GBIF's algorithm to ignore extra records in extension files that do not match with a GUID in the "occurrence.txt" is great news!<br></div><div><br></div><div>Thanks,</div><div>Matthew</div><div dir="ltr"><br></div><div class="gmail_quote" style=""><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">----------------------------------------------------------------------<br>
<br>
Message: 1<br>
Date: Mon, 2 May 2022 17:34:13 +0200<br>
From: Matthew Blissett <<a href="mailto:mblissett@gbif.org" target="_blank">mblissett@gbif.org</a>><br>
To: <a href="mailto:api-users@lists.gbif.org" target="_blank">api-users@lists.gbif.org</a><br>
Subject: Re: [API-users] DWC with "extra" images<br>
Message-ID: <<a href="mailto:08f90ede-83de-3305-339d-fc99b606d42c@gbif.org" target="_blank">08f90ede-83de-3305-339d-fc99b606d42c@gbif.org</a>><br>
Content-Type: text/plain; charset="utf-8"; Format="flowed"<br>
<br>
Hi Matthew,<br>
<br>
(I think you probably mean a files like media.txt or multimedia.txt)<br>
<br>
In general, extra records in the extension files (media etc) are <br>
ignored.  We don't have any plans to change this.<br>
<br>
Cheers,<br>
<br>
Matt<br>
<br>
On 15/04/2022 17:36, Matthew Cruz wrote:<br>
> What would happen in GBIF when processing a published DWC file if the <br>
> metadata.txt file has an ID corresponding to an image, but that ID is <br>
> not found in the occurrence.txt file?<br>
><br>
> Does the image get ignored or published despite there being no <br>
> corresponding metadata?<br>
><br>
> What else can you tell me about this process?<br>
><br>
> Thank you<br></blockquote></div></div>