Fix: XML tabel schema probleem in tkgetxml.cc #99
Add this suggestion to a batch that can be applied as a single commit.
This suggestion is invalid because no changes were made to the code.
Suggestions cannot be applied while the pull request is closed.
Suggestions cannot be applied while viewing a subset of changes.
Only one suggestion per line can be applied in a batch.
Add this suggestion to a batch that can be applied as a single commit.
Applying suggestions on deleted lines is not supported.
You must change the existing code in this line in order to create a valid suggestion.
Outdated suggestions cannot be applied.
This suggestion has been applied or marked resolved.
Suggestions cannot be applied from pending reviews.
Suggestions cannot be applied on multi-line comments.
Suggestions cannot be applied while the pull request is queued to merge.
Suggestion cannot be applied right now. Please check back later.
Achtergrond:
In local development is het fijn om met een kleine subset aan data te kunnen experimenteren (partiële data sync, bv. met een hoge skiptoken, hiervoor heb ik een optionele docker compose override file gemaakt en een tksync die een hogere skiptoken probeert (en exponentieel verlaagd bij 0 hits) tot er voor alle entiteiten data is aangetroffen).. Op deze manier kun je lokaal snel en eenvoudig starten met bijvoorbeeld afgelopen maand (als je ongeveer weet welke skiptoken dan een goed eikpunt is).
Het lijkt erop dat de repository altijd uitgaat van een full historic sync zijn een aantal issues waarschijnlijk nooit aan het licht gekomen;
Issue:
De tabel wordt aangemaakt met alleen (skiptoken INT) maar de insert probeert 6 kolommen: category, id, skiptoken, enclosure, updated, xml
Bij volledige sync vanaf begin werkt het 'toevallig', maar bij een hogere skiptoken sync faalt XML opslag compleet
'xml field is not a string' fouten omdat geen XML content wordt opgeslagen
Oplossing:
Tabel schema uitgebreid naar alle benodigde kolommen