Skip to content

Conversation

@Hedde
Copy link

@Hedde Hedde commented Jun 3, 2025

Achtergrond:
In local development is het fijn om met een kleine subset aan data te kunnen experimenteren (partiële data sync, bv. met een hoge skiptoken, hiervoor heb ik een optionele docker compose override file gemaakt en een tksync die een hogere skiptoken probeert (en exponentieel verlaagd bij 0 hits) tot er voor alle entiteiten data is aangetroffen).. Op deze manier kun je lokaal snel en eenvoudig starten met bijvoorbeeld afgelopen maand (als je ongeveer weet welke skiptoken dan een goed eikpunt is).
Het lijkt erop dat de repository altijd uitgaat van een full historic sync zijn een aantal issues waarschijnlijk nooit aan het licht gekomen;

Issue:
De tabel wordt aangemaakt met alleen (skiptoken INT) maar de insert probeert 6 kolommen: category, id, skiptoken, enclosure, updated, xml
Bij volledige sync vanaf begin werkt het 'toevallig', maar bij een hogere skiptoken sync faalt XML opslag compleet

'xml field is not a string' fouten omdat geen XML content wordt opgeslagen

Oplossing:
Tabel schema uitgebreid naar alle benodigde kolommen

Probleem treedt op bij partiële data sync (bv. met skiptoken)

Tabel wordt aangemaakt met alleen (skiptoken INT) maar insert probeert 6 kolommen: category, id, skiptoken, enclosure, updated, xml

Bij volledige sync vanaf begin werkt het toevallig, maar bij skiptoken sync faalt XML opslag compleet

Resultaat: 'xml field is not a string' fouten omdat geen XML content wordt opgeslagen

Oplossing: Tabel schema uitgebreid naar alle benodigde kolommen
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant