From 9eade2992c9f1dfc889443767bd071d805defaf7 Mon Sep 17 00:00:00 2001 From: pepezzzz <35323945+pepezzzz@users.noreply.github.com> Date: Wed, 26 Nov 2025 17:53:24 +0800 Subject: [PATCH 1/4] Update dumpling-overview.md --csv-separator $(echo -e "\x01") --- dumpling-overview.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/dumpling-overview.md b/dumpling-overview.md index 6a97f35541dc..368ff48d2052 100644 --- a/dumpling-overview.md +++ b/dumpling-overview.md @@ -378,7 +378,7 @@ SET GLOBAL tidb_gc_life_time = '10m'; | --cert | 用于 TLS 连接的 client certificate 文件的地址 | | --key | 用于 TLS 连接的 client private key 文件的地址 | | --csv-delimiter | CSV 文件中字符类型变量的定界符 | '"' | -| --csv-separator | CSV 文件中各值的分隔符,如果数据中可能有逗号,建议源文件导出时分隔符使用非常见组合字符| ','| +| --csv-separator | CSV 文件中各值的分隔符,如果数据中可能有逗号,建议源文件导出时分隔符使用非常见组合字符,支持使用不可见字符 $(echo -e "\x01") 作为参数 | ','| | --csv-null-value | CSV 文件空值的表示 | "\\N" | | --csv-line-terminator | CSV 文件中表示行尾的换行符。将数据导出为 CSV 文件时,可以通过该选项传入所需的换行符。该选项支持 "\\r\\n" 和 "\\n",默认值为 "\\r\\n",和历史版本保持一致。由于 bash 中不同的引号会应用不同的转义规则,如需指定 LF 为换行符,可使用类似 `--csv-line-terminator $'\n'` 的语法。| "\\r\\n" | | --csv-output-dialect | 表示可以将源数据导出成数据库所需的格式存储到 CSV。该选项取值可为 `""`,`"snowflake"`、`"redshift"`、`"bigquery"`。默认值为 `""`,表示会按 UTF-8 进行编码并导出数据。如果设置为 `"snowflake"` 或 `"redshift"`,会把 Binary 数据类型转换成十六进制,但会丢失十六进制数的前缀 `0x`,例如 `0x61` 将被表示成 `61`。如果设置为 `"bigquery"`,会使用 base64 对 Binary 数据类型进行编码。在某些情况下,Binary 字符串会出现乱码。| `""` | From 78e07be395cb1fad7af7a3defcca90459afc784d Mon Sep 17 00:00:00 2001 From: pepezzzz <35323945+pepezzzz@users.noreply.github.com> Date: Thu, 27 Nov 2025 09:49:08 +0800 Subject: [PATCH 2/4] Update dumpling-overview.md --csv-separator $'\001' --- dumpling-overview.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/dumpling-overview.md b/dumpling-overview.md index 368ff48d2052..971441dbde47 100644 --- a/dumpling-overview.md +++ b/dumpling-overview.md @@ -378,7 +378,7 @@ SET GLOBAL tidb_gc_life_time = '10m'; | --cert | 用于 TLS 连接的 client certificate 文件的地址 | | --key | 用于 TLS 连接的 client private key 文件的地址 | | --csv-delimiter | CSV 文件中字符类型变量的定界符 | '"' | -| --csv-separator | CSV 文件中各值的分隔符,如果数据中可能有逗号,建议源文件导出时分隔符使用非常见组合字符,支持使用不可见字符 $(echo -e "\x01") 作为参数 | ','| +| --csv-separator | CSV 文件中各值的分隔符,如果数据中可能有逗号,建议源文件导出时分隔符使用非常见组合字符,支持不可见字符作为分隔符,如: --csv-separator $'\001' | ','| | --csv-null-value | CSV 文件空值的表示 | "\\N" | | --csv-line-terminator | CSV 文件中表示行尾的换行符。将数据导出为 CSV 文件时,可以通过该选项传入所需的换行符。该选项支持 "\\r\\n" 和 "\\n",默认值为 "\\r\\n",和历史版本保持一致。由于 bash 中不同的引号会应用不同的转义规则,如需指定 LF 为换行符,可使用类似 `--csv-line-terminator $'\n'` 的语法。| "\\r\\n" | | --csv-output-dialect | 表示可以将源数据导出成数据库所需的格式存储到 CSV。该选项取值可为 `""`,`"snowflake"`、`"redshift"`、`"bigquery"`。默认值为 `""`,表示会按 UTF-8 进行编码并导出数据。如果设置为 `"snowflake"` 或 `"redshift"`,会把 Binary 数据类型转换成十六进制,但会丢失十六进制数的前缀 `0x`,例如 `0x61` 将被表示成 `61`。如果设置为 `"bigquery"`,会使用 base64 对 Binary 数据类型进行编码。在某些情况下,Binary 字符串会出现乱码。| `""` | From ff860063090ab9c34ff0b3481393619d39ac8576 Mon Sep 17 00:00:00 2001 From: xixirangrang Date: Thu, 27 Nov 2025 11:37:54 +0800 Subject: [PATCH 3/4] Update dumpling-overview.md --- dumpling-overview.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/dumpling-overview.md b/dumpling-overview.md index 971441dbde47..c13a3d780adc 100644 --- a/dumpling-overview.md +++ b/dumpling-overview.md @@ -378,7 +378,7 @@ SET GLOBAL tidb_gc_life_time = '10m'; | --cert | 用于 TLS 连接的 client certificate 文件的地址 | | --key | 用于 TLS 连接的 client private key 文件的地址 | | --csv-delimiter | CSV 文件中字符类型变量的定界符 | '"' | -| --csv-separator | CSV 文件中各值的分隔符,如果数据中可能有逗号,建议源文件导出时分隔符使用非常见组合字符,支持不可见字符作为分隔符,如: --csv-separator $'\001' | ','| +| --csv-separator | CSV 文件中各值的分隔符,如果数据中可能有逗号,建议源文件导出时分隔符使用非常见组合字符,支持不可见字符作为分隔符,如: `--csv-separator $'\001'` | ','| | --csv-null-value | CSV 文件空值的表示 | "\\N" | | --csv-line-terminator | CSV 文件中表示行尾的换行符。将数据导出为 CSV 文件时,可以通过该选项传入所需的换行符。该选项支持 "\\r\\n" 和 "\\n",默认值为 "\\r\\n",和历史版本保持一致。由于 bash 中不同的引号会应用不同的转义规则,如需指定 LF 为换行符,可使用类似 `--csv-line-terminator $'\n'` 的语法。| "\\r\\n" | | --csv-output-dialect | 表示可以将源数据导出成数据库所需的格式存储到 CSV。该选项取值可为 `""`,`"snowflake"`、`"redshift"`、`"bigquery"`。默认值为 `""`,表示会按 UTF-8 进行编码并导出数据。如果设置为 `"snowflake"` 或 `"redshift"`,会把 Binary 数据类型转换成十六进制,但会丢失十六进制数的前缀 `0x`,例如 `0x61` 将被表示成 `61`。如果设置为 `"bigquery"`,会使用 base64 对 Binary 数据类型进行编码。在某些情况下,Binary 字符串会出现乱码。| `""` | From 110f7ad73ca15c9f6bde9548e6216b3f8aaaf259 Mon Sep 17 00:00:00 2001 From: xixirangrang Date: Thu, 27 Nov 2025 11:46:41 +0800 Subject: [PATCH 4/4] Update dumpling-overview.md --- dumpling-overview.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/dumpling-overview.md b/dumpling-overview.md index c13a3d780adc..13d027fe6570 100644 --- a/dumpling-overview.md +++ b/dumpling-overview.md @@ -378,7 +378,7 @@ SET GLOBAL tidb_gc_life_time = '10m'; | --cert | 用于 TLS 连接的 client certificate 文件的地址 | | --key | 用于 TLS 连接的 client private key 文件的地址 | | --csv-delimiter | CSV 文件中字符类型变量的定界符 | '"' | -| --csv-separator | CSV 文件中各值的分隔符,如果数据中可能有逗号,建议源文件导出时分隔符使用非常见组合字符,支持不可见字符作为分隔符,如: `--csv-separator $'\001'` | ','| +| --csv-separator | CSV 文件中各值的分隔符。如果数据中包含逗号,建议导出源文件时,使用非常见组合字符作为分隔符。支持不可见字符作为分隔符,如:`--csv-separator $'\001'` | ','| | --csv-null-value | CSV 文件空值的表示 | "\\N" | | --csv-line-terminator | CSV 文件中表示行尾的换行符。将数据导出为 CSV 文件时,可以通过该选项传入所需的换行符。该选项支持 "\\r\\n" 和 "\\n",默认值为 "\\r\\n",和历史版本保持一致。由于 bash 中不同的引号会应用不同的转义规则,如需指定 LF 为换行符,可使用类似 `--csv-line-terminator $'\n'` 的语法。| "\\r\\n" | | --csv-output-dialect | 表示可以将源数据导出成数据库所需的格式存储到 CSV。该选项取值可为 `""`,`"snowflake"`、`"redshift"`、`"bigquery"`。默认值为 `""`,表示会按 UTF-8 进行编码并导出数据。如果设置为 `"snowflake"` 或 `"redshift"`,会把 Binary 数据类型转换成十六进制,但会丢失十六进制数的前缀 `0x`,例如 `0x61` 将被表示成 `61`。如果设置为 `"bigquery"`,会使用 base64 对 Binary 数据类型进行编码。在某些情况下,Binary 字符串会出现乱码。| `""` |