Handle hive special control chars

treysp · treysp · commit 40b19884fb61 · 2025-11-17T12:29:38.000-06:00
diff --git a/sqlglot/dialects/duckdb.py b/sqlglot/dialects/duckdb.py
@@ -58,6 +58,15 @@
     "]": r"\]",
 }
 
+# Whitespace control characters that DuckDB must process with `CHR({val})` calls
+WS_CONTROL_CHARS_TO_DUCK = {
+    "\u000b": 11,
+    "\u001c": 28,
+    "\u001d": 29,
+    "\u001e": 30,
+    "\u001f": 31,
+}
+
 
 # BigQuery -> DuckDB conversion for the DATE function
 def _date_sql(self: DuckDB.Generator, expression: exp.Date) -> str:
@@ -299,16 +308,49 @@ def _anyvalue_sql(self: DuckDB.Generator, expression: exp.AnyValue) -> str:
     return self.function_fallback_sql(expression)
 
 
+def _literal_sql_with_ws_chr(self: DuckDB.Generator, literal: str) -> str:
+    # DuckDB does not support \uXXXX escapes, so rebuild literals with CHR() for special whitespace controls.
+    if not any(ch in WS_CONTROL_CHARS_TO_DUCK for ch in literal):
+        return self.sql(exp.Literal.string(literal))
+
+    sql_segments: t.List[str] = []
+    literal_chars: t.List[str] = []
+
+    for ch in literal:
+        duckdb_char_code = WS_CONTROL_CHARS_TO_DUCK.get(ch)
+        if not duckdb_char_code:
+            literal_chars.append(ch)
+            continue
+
+        if literal_chars:
+            sql_segments.append(self.sql(exp.Literal.string("".join(literal_chars))))
+            literal_chars.clear()
+
+        sql_segments.append(self.func("CHR", exp.Literal.number(str(duckdb_char_code))))
+
+    if literal_chars:
+        sql_segments.append(self.sql(exp.Literal.string("".join(literal_chars))))
+
+    sql = " || ".join(sql_segments)
+    return sql if len(sql_segments) == 1 else f"({sql})"
+
+
 def _escape_regex_metachars(
     self: DuckDB.Generator, delimiters: t.Optional[exp.Expression], delimiters_sql: str
 ) -> str:
+    r"""
+    Escapes regex metacharacters in delimiter strings for use in character classes [].
+
+    Handles: \ - ^ [ ] which have special meaning in regex character classes.
+    For literals: escapes at transpile time. For dynamic expressions: generates REPLACE() calls.
+    """
     if not delimiters:
         return delimiters_sql
 
     if delimiters.is_string:
         literal_value = delimiters.this
         escaped_literal = "".join(REGEX_ESCAPE_REPLACEMENTS.get(ch, ch) for ch in literal_value)
-        return self.sql(exp.Literal.string(escaped_literal))
+        return _literal_sql_with_ws_chr(self, escaped_literal)
 
     escaped_sql = delimiters_sql
     for raw, escaped in REGEX_ESCAPE_REPLACEMENTS.items():
@@ -325,20 +367,14 @@ def _escape_regex_metachars(
 def _build_capitalization_sql(
     self: DuckDB.Generator,
     value_to_split: str,
-    raw_delimiters_sql: str,
-    escaped_delimiters_sql: t.Optional[str] = None,
-    convert_delim_to_regex: bool = True,
+    delimiters_sql: str,
 ) -> str:
     # empty string delimiter --> treat value as one word, no need to split
-    if raw_delimiters_sql == "''":
+    if delimiters_sql == "''":
         return f"UPPER(LEFT({value_to_split}, 1)) || LOWER(SUBSTRING({value_to_split}, 2))"
 
-    regex_ready_sql = escaped_delimiters_sql or raw_delimiters_sql
-    delim_regex_sql = regex_ready_sql
-    split_regex_sql = regex_ready_sql
-    if convert_delim_to_regex:
-        delim_regex_sql = f"CONCAT('[', {regex_ready_sql}, ']')"
-        split_regex_sql = f"CONCAT('([', {regex_ready_sql}, ']+|[^', {regex_ready_sql}, ']+)')"
+    delim_regex_sql = f"CONCAT('[', {delimiters_sql}, ']')"
+    split_regex_sql = f"CONCAT('([', {delimiters_sql}, ']+|[^', {delimiters_sql}, ']+)')"
 
     # REGEXP_EXTRACT_ALL produces a list of string segments, alternating between delimiter and non-delimiter segments.
     # We do not know whether the first segment is a delimiter or not, so we check the first character of the string
@@ -369,19 +405,10 @@ def _initcap_sql(self: DuckDB.Generator, expression: exp.Initcap) -> str:
     this_sql = self.sql(expression, "this")
     delimiters = expression.args.get("expression")
     delimiters_sql = self.sql(delimiters)
-    escaped_delimiters_sql = (
-        _escape_regex_metachars(self, delimiters, delimiters_sql)
-        if not isinstance(delimiters, exp.Null)
-        else delimiters_sql
-    )
 
-    return _build_capitalization_sql(
-        self,
-        this_sql,
-        delimiters_sql,
-        escaped_delimiters_sql,
-        convert_delim_to_regex=not isinstance(delimiters, exp.Null),
-    )
+    escaped_delimiters_sql = _escape_regex_metachars(self, delimiters, delimiters_sql)
+
+    return _build_capitalization_sql(self, this_sql, escaped_delimiters_sql)
 
 
 class DuckDB(Dialect):
diff --git a/sqlglot/dialects/hive.py b/sqlglot/dialects/hive.py
@@ -219,6 +219,10 @@ class Hive(Dialect):
 
     EXPRESSION_METADATA = EXPRESSION_METADATA.copy()
 
+    # https://cwiki.apache.org/confluence/pages/viewpage.action?pageId=27362046#LanguageManualUDF-StringFunctions
+    # https://github.com/apache/hive/blob/master/ql/src/java/org/apache/hadoop/hive/ql/exec/Utilities.java#L266-L269
+    INITCAP_DEFAULT_DELIMITER_CHARS = " \t\n\r\f\u000b\u001c\u001d\u001e\u001f"
+
     # Support only the non-ANSI mode (default for Hive, Spark2, Spark)
     COERCES_TO = defaultdict(set, deepcopy(TypeAnnotator.COERCES_TO))
     for target_type in {
diff --git a/sqlglot/dialects/spark2.py b/sqlglot/dialects/spark2.py
@@ -121,7 +121,8 @@ class Spark2(Hive):
 
     # https://spark.apache.org/docs/latest/api/sql/index.html#initcap
     # https://docs.databricks.com/aws/en/sql/language-manual/functions/initcap
-    INITCAP_DEFAULT_DELIMITER_CHARS = " \t\n\r\f\v"
+    # https://github.com/apache/spark/blob/master/common/unsafe/src/main/java/org/apache/spark/unsafe/types/UTF8String.java#L859-L905
+    INITCAP_DEFAULT_DELIMITER_CHARS = " "
 
     class Tokenizer(Hive.Tokenizer):
         HEX_STRINGS = [("X'", "'"), ("x'", "'")]
diff --git a/tests/dialects/test_dialect.py b/tests/dialects/test_dialect.py
@@ -4313,18 +4313,13 @@ def test_initcap(self):
             "spark": Spark2.INITCAP_DEFAULT_DELIMITER_CHARS,
         }
 
-        REGEX_LITERAL_ESCAPES = {
-            "\\": "\\\\",
-            "-": "\\-",
-            "^": "\\^",
-            "[": "\\[",
-            "]": "\\]",
+        duckdb_default_delimiter_sql = {
+            "": "ARRAY_TO_STRING(CASE WHEN REGEXP_MATCHES(LEFT(col, 1), '[' || (' \t\n\r\x0c' || CHR(11) || '!\"#$%&''()*+,\\\\\\-./:;<=>?@\\\\\\[\\\\\\]\\^_`{|}~') || ']') THEN LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || (' \t\n\r\x0c' || CHR(11) || '!\"#$%&''()*+,\\\\\\-./:;<=>?@\\\\\\[\\\\\\]\\^_`{|}~') || ']+|[^' || (' \t\n\r\x0c' || CHR(11) || '!\"#$%&''()*+,\\\\\\-./:;<=>?@\\\\\\[\\\\\\]\\^_`{|}~') || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 0 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) ELSE LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || (' \t\n\r\x0c' || CHR(11) || '!\"#$%&''()*+,\\\\\\-./:;<=>?@\\\\\\[\\\\\\]\\^_`{|}~') || ']+|[^' || (' \t\n\r\x0c' || CHR(11) || '!\"#$%&''()*+,\\\\\\-./:;<=>?@\\\\\\[\\\\\\]\\^_`{|}~') || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 1 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) END, '')",
+            "bigquery": "ARRAY_TO_STRING(CASE WHEN REGEXP_MATCHES(LEFT(col, 1), '[' || (' \t\n\r\x0c' || CHR(11) || '\\\\\\[\\\\\\](){}/|<>!?@\"\\^#$&~_,.:;*%+\\\\\\-') || ']') THEN LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || (' \t\n\r\x0c' || CHR(11) || '\\\\\\[\\\\\\](){}/|<>!?@\"\\^#$&~_,.:;*%+\\\\\\-') || ']+|[^' || (' \t\n\r\x0c' || CHR(11) || '\\\\\\[\\\\\\](){}/|<>!?@\"\\^#$&~_,.:;*%+\\\\\\-') || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 0 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) ELSE LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || (' \t\n\r\x0c' || CHR(11) || '\\\\\\[\\\\\\](){}/|<>!?@\"\\^#$&~_,.:;*%+\\\\\\-') || ']+|[^' || (' \t\n\r\x0c' || CHR(11) || '\\\\\\[\\\\\\](){}/|<>!?@\"\\^#$&~_,.:;*%+\\\\\\-') || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 1 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) END, '')",
+            "snowflake": "ARRAY_TO_STRING(CASE WHEN REGEXP_MATCHES(LEFT(col, 1), '[' || (' \t\n\r\x0c' || CHR(11) || '!?@\"\\^#$&~_,.:;+\\\\\\-*%/|\\\\\\[\\\\\\](){}<>') || ']') THEN LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || (' \t\n\r\x0c' || CHR(11) || '!?@\"\\^#$&~_,.:;+\\\\\\-*%/|\\\\\\[\\\\\\](){}<>') || ']+|[^' || (' \t\n\r\x0c' || CHR(11) || '!?@\"\\^#$&~_,.:;+\\\\\\-*%/|\\\\\\[\\\\\\](){}<>') || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 0 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) ELSE LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || (' \t\n\r\x0c' || CHR(11) || '!?@\"\\^#$&~_,.:;+\\\\\\-*%/|\\\\\\[\\\\\\](){}<>') || ']+|[^' || (' \t\n\r\x0c' || CHR(11) || '!?@\"\\^#$&~_,.:;+\\\\\\-*%/|\\\\\\[\\\\\\](){}<>') || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 1 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) END, '')",
+            "spark": "ARRAY_TO_STRING(CASE WHEN REGEXP_MATCHES(LEFT(col, 1), '[' || ' ' || ']') THEN LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || ' ' || ']+|[^' || ' ' || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 0 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) ELSE LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || ' ' || ']+|[^' || ' ' || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 1 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) END, '')",
         }
 
-        def duckdb_regex_literal_sql(delimiters: str) -> str:
-            escaped_literal = "".join(REGEX_LITERAL_ESCAPES.get(ch, ch) for ch in delimiters)
-            return exp.Literal.string(escaped_literal).sql("duckdb")
-
         # None delimiters arg doesn't error
         with self.subTest("Testing INITCAP with None delimiters arg"):
             self.assertEqual(exp.Initcap(this=exp.Literal.string("col")).sql(), "INITCAP('col')")
@@ -4355,17 +4350,10 @@ def duckdb_regex_literal_sql(delimiters: str) -> str:
 
         for dialect, default_delimiters in delimiter_chars.items():
             with self.subTest(f"DuckDB rewrite for {dialect or 'default'} default delimiters"):
-                escaped_literal = duckdb_regex_literal_sql(default_delimiters)
-                expected = (
-                    "ARRAY_TO_STRING("
-                    f"CASE WHEN REGEXP_MATCHES(LEFT(col, 1), '[' || {escaped_literal} || ']') "
-                    f"THEN LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || {escaped_literal} || ']+|[^' || {escaped_literal} || ']+)'), "
-                    f"(seg, idx) -> CASE WHEN idx % 2 = 0 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) "
-                    f"ELSE LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || {escaped_literal} || ']+|[^' || {escaped_literal} || ']+)'), "
-                    f"(seg, idx) -> CASE WHEN idx % 2 = 1 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) "
-                    "END, '')"
+                self.assertEqual(
+                    parse_one("INITCAP(col)", read=dialect).sql("duckdb"),
+                    duckdb_default_delimiter_sql[dialect],
                 )
-                self.assertEqual(parse_one("INITCAP(col)", read=dialect).sql("duckdb"), expected)
 
         # DuckDB generation for BQ/Snowflake calls with custom delimiters arg
         for dialect in ("bigquery", "snowflake"):
@@ -4378,49 +4366,41 @@ def duckdb_regex_literal_sql(delimiters: str) -> str:
 
             query = "INITCAP(col, NULL)"
             with self.subTest(f"DuckDB generation for {query} from {dialect}"):
+                # NULL delimiters generate verbose REPLACE calls but still evaluate to NULL correctly
+                escaped_null = r"REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(NULL, '\', '\\'), '-', '\-'), '^', '\^'), '[', '\['), ']', '\]')"
                 self.assertEqual(
                     parse_one(query, read=dialect).sql("duckdb"),
-                    "ARRAY_TO_STRING("
-                    "CASE WHEN REGEXP_MATCHES(LEFT(col, 1), NULL) "
-                    "THEN LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, NULL), "
-                    "(seg, idx) -> CASE WHEN idx % 2 = 0 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) "
-                    "ELSE LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, NULL), "
-                    "(seg, idx) -> CASE WHEN idx % 2 = 1 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) "
-                    "END, '')",
+                    f"ARRAY_TO_STRING("
+                    f"CASE WHEN REGEXP_MATCHES(LEFT(col, 1), '[' || {escaped_null} || ']') "
+                    f"THEN LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || {escaped_null} || ']+|[^' || {escaped_null} || ']+)'), "
+                    f"(seg, idx) -> CASE WHEN idx % 2 = 0 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) "
+                    f"ELSE LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || {escaped_null} || ']+|[^' || {escaped_null} || ']+)'), "
+                    f"(seg, idx) -> CASE WHEN idx % 2 = 1 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) "
+                    f"END, '')",
                 )
 
-            for custom_delimiter in (" ", "@", " _@", r"\\"):
+            custom_delimiter_expectations = {
+                " ": "ARRAY_TO_STRING(CASE WHEN REGEXP_MATCHES(LEFT(col, 1), '[' || ' ' || ']') THEN LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || ' ' || ']+|[^' || ' ' || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 0 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) ELSE LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || ' ' || ']+|[^' || ' ' || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 1 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) END, '')",
+                "@": "ARRAY_TO_STRING(CASE WHEN REGEXP_MATCHES(LEFT(col, 1), '[' || '@' || ']') THEN LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || '@' || ']+|[^' || '@' || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 0 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) ELSE LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || '@' || ']+|[^' || '@' || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 1 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) END, '')",
+                " _@": "ARRAY_TO_STRING(CASE WHEN REGEXP_MATCHES(LEFT(col, 1), '[' || ' _@' || ']') THEN LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || ' _@' || ']+|[^' || ' _@' || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 0 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) ELSE LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || ' _@' || ']+|[^' || ' _@' || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 1 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) END, '')",
+                r"\\": "ARRAY_TO_STRING(CASE WHEN REGEXP_MATCHES(LEFT(col, 1), '[' || '\\\\\\\\' || ']') THEN LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || '\\\\\\\\' || ']+|[^' || '\\\\\\\\' || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 0 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) ELSE LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || '\\\\\\\\' || ']+|[^' || '\\\\\\\\' || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 1 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) END, '')",
+                "\u000b": "ARRAY_TO_STRING(CASE WHEN REGEXP_MATCHES(LEFT(col, 1), '[' || CHR(11) || ']') THEN LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || CHR(11) || ']+|[^' || CHR(11) || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 0 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) ELSE LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || CHR(11) || ']+|[^' || CHR(11) || ']+)'), (seg, idx) -> CASE WHEN idx % 2 = 1 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) END, '')",
+            }
+            for custom_delimiter, expected_duckdb_sql in custom_delimiter_expectations.items():
                 with self.subTest(
                     f"DuckDB generation for INITCAP(col, {custom_delimiter}) from {dialect}"
                 ):
                     literal_sql = exp.Literal.string(custom_delimiter).sql(dialect)
                     expression = parse_one(f"INITCAP(col, {literal_sql})", read=dialect)
-                    duckdb_sql = expression.sql("duckdb")
-                    escaped_custom_delimiter = duckdb_regex_literal_sql(custom_delimiter)
                     self.assertEqual(
-                        duckdb_sql,
-                        "ARRAY_TO_STRING("
-                        f"CASE WHEN REGEXP_MATCHES(LEFT(col, 1), '[' || {escaped_custom_delimiter} || ']') "
-                        f"THEN LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || {escaped_custom_delimiter} || ']+|[^' || {escaped_custom_delimiter} || ']+)'), "
-                        f"(seg, idx) -> CASE WHEN idx % 2 = 0 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) "
-                        f"ELSE LIST_TRANSFORM(REGEXP_EXTRACT_ALL(col, '([' || {escaped_custom_delimiter} || ']+|[^' || {escaped_custom_delimiter} || ']+)'), "
-                        f"(seg, idx) -> CASE WHEN idx % 2 = 1 THEN UPPER(LEFT(seg, 1)) || LOWER(SUBSTRING(seg, 2)) ELSE seg END) "
-                        "END, '')",
+                        expression.sql("duckdb"),
+                        expected_duckdb_sql,
                     )
 
-            def escape_expression_sql(sql: str) -> str:
-                escaped_sql = sql
-                for raw, escaped in REGEX_LITERAL_ESCAPES.items():
-                    raw_sql = exp.Literal.string(raw).sql()
-                    escaped_literal_sql = exp.Literal.string(escaped).sql()
-                    escaped_sql = f"REPLACE({escaped_sql}, {raw_sql}, {escaped_literal_sql})"
-
-                return escaped_sql
-
             with self.subTest(
                 f"DuckDB generation for INITCAP subquery as custom delimiter arg from {dialect}"
             ):
-                escaped_subquery = escape_expression_sql("(SELECT delimiter FROM settings LIMIT 1)")
+                escaped_subquery = "REPLACE(REPLACE(REPLACE(REPLACE(REPLACE((SELECT delimiter FROM settings LIMIT 1), '\\', '\\\\'), '-', '\\-'), '^', '\\^'), '[', '\\['), ']', '\\]')"
                 self.assertEqual(
                     parse_one(
                         "INITCAP(col, (SELECT delimiter FROM settings LIMIT 1))", read=dialect
diff --git a/tests/dialects/test_hive.py b/tests/dialects/test_hive.py