From 608b46c0bc324a3c78f7085590e1723d87644eac Mon Sep 17 00:00:00 2001
From: Hans Ott <hansott@hotmail.be>
Date: Fri, 27 Mar 2026 16:07:01 +0100
Subject: [PATCH 1/4] Block SQL queries that fail tokenization

Our SQL injection detection tokenizes queries to check them. If the
tokenizer can't parse a query, we skip it and the query goes through.
Some databases still execute partially valid queries though: ClickHouse
ignores junk after ; and SQLite runs everything before an unclosed /*.

Now when user input shows up in a query we can't tokenize, we treat
it as an attack. On by default, opt out with AIKIDO_BLOCK_INVALID_SQL=false.
---
 .../vulnerabilities/sql_injection/__init__.py | 13 +++------
 .../context_contains_sql_injection.py         | 27 ++++++++++++++++++-
 docs/invalid-sql-queries.md                   | 11 ++++++++
 3 files changed, 41 insertions(+), 10 deletions(-)
 create mode 100644 docs/invalid-sql-queries.md

diff --git a/aikido_zen/vulnerabilities/sql_injection/__init__.py b/aikido_zen/vulnerabilities/sql_injection/__init__.py
index 745c8b5b6..b4a9cc657 100644
--- a/aikido_zen/vulnerabilities/sql_injection/__init__.py
+++ b/aikido_zen/vulnerabilities/sql_injection/__init__.py
@@ -18,7 +18,7 @@ def detect_sql_injection(query, user_input, dialect):
         query_l = query.lower()
         userinput_l = user_input.lower()
         if should_return_early(query_l, userinput_l):
-            return False
+            return 0
 
         internals_lib = ctypes.CDLL(get_binary_path())
         internals_lib.detect_sql_injection.argtypes = [
@@ -52,17 +52,12 @@ def detect_sql_injection(query, user_input, dialect):
             logger.debug(
                 "Unable to check for SQL Injection, an error occurred in the library"
             )
-            return False
+            return 0
 
-        # This means that the library failed to tokenize the SQL query
-        if c_int_res == 3:
-            logger.debug("Unable to check for SQL Injection, SQL tokenization failed")
-            return False
-
-        return c_int_res == 1
+        return c_int_res
     except Exception as e:
         logger.debug("Exception in SQL algo: %s", e)
-    return False
+    return 0
 
 
 def should_return_early(query, user_input):
diff --git a/aikido_zen/vulnerabilities/sql_injection/context_contains_sql_injection.py b/aikido_zen/vulnerabilities/sql_injection/context_contains_sql_injection.py
index 6a25c49fe..4c3bc1516 100644
--- a/aikido_zen/vulnerabilities/sql_injection/context_contains_sql_injection.py
+++ b/aikido_zen/vulnerabilities/sql_injection/context_contains_sql_injection.py
@@ -2,10 +2,19 @@
 This will check the context of the request for SQL Injections
 """
 
+import os
+
 from aikido_zen.helpers.extract_strings_from_context import extract_strings_from_context
 from aikido_zen.vulnerabilities.sql_injection import detect_sql_injection
 
 
+def should_block_invalid_sql_queries():
+    env_val = os.environ.get("AIKIDO_BLOCK_INVALID_SQL")
+    if env_val is None:
+        return True
+    return env_val.lower() in ["true", "1"]
+
+
 def context_contains_sql_injection(sql, operation, context, dialect):
     """
     This will check the context of the request for SQL Injections
@@ -14,7 +23,22 @@ def context_contains_sql_injection(sql, operation, context, dialect):
         # Only supports SQL queries that are strings, return otherwise.
         return {}
     for user_input, path, source in extract_strings_from_context(context):
-        if detect_sql_injection(sql, user_input, dialect):
+        result = detect_sql_injection(sql, user_input, dialect)
+
+        if result == 1:
+            return {
+                "operation": operation,
+                "kind": "sql_injection",
+                "source": source,
+                "pathToPayload": path,
+                "metadata": {
+                    "sql": sql,
+                    "dialect": dialect,
+                },
+                "payload": user_input,
+            }
+
+        if result == 3 and should_block_invalid_sql_queries():
             return {
                 "operation": operation,
                 "kind": "sql_injection",
@@ -23,6 +47,7 @@ def context_contains_sql_injection(sql, operation, context, dialect):
                 "metadata": {
                     "sql": sql,
                     "dialect": dialect,
+                    "failedToTokenize": "true",
                 },
                 "payload": user_input,
             }
diff --git a/docs/invalid-sql-queries.md b/docs/invalid-sql-queries.md
new file mode 100644
index 000000000..74f52cd98
--- /dev/null
+++ b/docs/invalid-sql-queries.md
@@ -0,0 +1,11 @@
+# Blocking invalid SQL queries
+
+Zen blocks SQL queries that it can't tokenize when they contain user input. This prevents attackers from bypassing SQL injection detection with malformed queries. For example, ClickHouse ignores invalid SQL after `;`, and SQLite runs queries before an unclosed `/*` comment.
+
+This is on by default. In blocking mode, these queries are blocked. In detection-only mode, they are reported but still executed.
+
+If you see false positives (legitimate queries being blocked), disable it with:
+
+```
+AIKIDO_BLOCK_INVALID_SQL=false python app.py
+```

From cd9547ef01da8d4817c242978ea6da88d525a29d Mon Sep 17 00:00:00 2001
From: Hans Ott <hansott@hotmail.be>
Date: Fri, 27 Mar 2026 16:25:58 +0100
Subject: [PATCH 2/4] Move invalid SQL test cases to dedicated test

---
 .../vulnerabilities/sql_injection/init_test.py    | 15 ++++++++-------
 1 file changed, 8 insertions(+), 7 deletions(-)

diff --git a/aikido_zen/vulnerabilities/sql_injection/init_test.py b/aikido_zen/vulnerabilities/sql_injection/init_test.py
index f7b7a8acf..8187e8bc1 100644
--- a/aikido_zen/vulnerabilities/sql_injection/init_test.py
+++ b/aikido_zen/vulnerabilities/sql_injection/init_test.py
@@ -171,9 +171,6 @@ def test_is_not_injection():
 
 
 def test_allow_escape_sequences():
-    # Invalid queries :
-    is_not_sql_injection("SELECT * FROM users WHERE id = 'users\\'", "users\\")
-
     is_not_sql_injection("SELECT * FROM users WHERE id = 'users\\\\'", "users\\\\")
     is_not_sql_injection("SELECT * FROM users WHERE id = '\nusers'", "\nusers")
     is_not_sql_injection("SELECT * FROM users WHERE id = '\rusers'", "\rusers")
@@ -212,10 +209,6 @@ def test_check_string_safely_escaped():
     is_not_sql_injection(
         'SELECT * FROM comments WHERE comment = "I`m writting you"', "I`m writting you"
     )
-    # Invalid query (strings don't terminate)
-    is_not_sql_injection(
-        "SELECT * FROM comments WHERE comment = 'I'm writting you'", "I'm writting you"
-    )
     # Positive example of same query :
     is_sql_injection(
         "SELECT * FROM comments WHERE comment = 'I'm writting you--'",
@@ -393,6 +386,14 @@ def test_lowercased_input_sql_injection():
 """
 
 
+def test_block_invalid_sql_queries():
+    # These are invalid queries (e.g. unterminated strings) that fail tokenization
+    is_sql_injection("SELECT * FROM users WHERE id = 'users\\'", "users\\")
+    is_sql_injection(
+        "SELECT * FROM comments WHERE comment = 'I'm writting you'", "I'm writting you"
+    )
+
+
 def test_function_calls_as_sql_injections():
     is_sql_injection("foobar()", "foobar()")
     is_sql_injection("foobar(1234567)", "foobar(1234567)")

From d493aeb4ac1105ec07f275595cb5e619f1c7cf1e Mon Sep 17 00:00:00 2001
From: Hans Ott <hansott@hotmail.be>
Date: Fri, 27 Mar 2026 16:48:49 +0100
Subject: [PATCH 3/4] Restrict backslash escape test to MySQL dialect

Backslash escapes are MySQL-specific, so the unterminated string
caused by a trailing backslash only fails tokenization in MySQL.
---
 aikido_zen/vulnerabilities/sql_injection/init_test.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/aikido_zen/vulnerabilities/sql_injection/init_test.py b/aikido_zen/vulnerabilities/sql_injection/init_test.py
index 8187e8bc1..e6a7ea68d 100644
--- a/aikido_zen/vulnerabilities/sql_injection/init_test.py
+++ b/aikido_zen/vulnerabilities/sql_injection/init_test.py
@@ -388,7 +388,7 @@ def test_lowercased_input_sql_injection():
 
 def test_block_invalid_sql_queries():
     # These are invalid queries (e.g. unterminated strings) that fail tokenization
-    is_sql_injection("SELECT * FROM users WHERE id = 'users\\'", "users\\")
+    is_sql_injection("SELECT * FROM users WHERE id = 'users\\'", "users\\", "mysql")
     is_sql_injection(
         "SELECT * FROM comments WHERE comment = 'I'm writting you'", "I'm writting you"
     )

From 36a78168ba2fc8cb584d838d416009680defa1e4 Mon Sep 17 00:00:00 2001
From: Hans Ott <hansott@hotmail.be>
Date: Fri, 27 Mar 2026 17:23:07 +0100
Subject: [PATCH 4/4] Assert exact return codes in SQL injection tests

The test helpers now check specific return codes (1 for injection,
3 for failed tokenization, 0 for no injection) instead of boolean
equality. Invalid SQL tests use a dedicated is_invalid_sql helper.
---
 .../vulnerabilities/sql_injection/init_test.py  | 17 +++++++++++++----
 1 file changed, 13 insertions(+), 4 deletions(-)

diff --git a/aikido_zen/vulnerabilities/sql_injection/init_test.py b/aikido_zen/vulnerabilities/sql_injection/init_test.py
index e6a7ea68d..f3da18415 100644
--- a/aikido_zen/vulnerabilities/sql_injection/init_test.py
+++ b/aikido_zen/vulnerabilities/sql_injection/init_test.py
@@ -73,16 +73,25 @@ def is_sql_injection(sql, input, dialect="all"):
         if dialect == "all" or dialect == current:
             result = detect_sql_injection(sql, input, current)
             assert (
-                result == True
+                result == 1
             ), f"Expected SQL injection for SQL: {sql} and input: {input} in {current} dialect"
 
 
+def is_invalid_sql(sql, input, dialect="all"):
+    for current in DIALECTS:
+        if dialect == "all" or dialect == current:
+            result = detect_sql_injection(sql, input, current)
+            assert (
+                result == 3
+            ), f"Expected failed tokenization for SQL: {sql} and input: {input} in {current} dialect"
+
+
 def is_not_sql_injection(sql, input, dialect="all"):
     for current in DIALECTS:
         if dialect == "all" or dialect == current:
             result = detect_sql_injection(sql, input, current)
             assert (
-                result == False
+                result == 0
             ), f"Expected no SQL injection for SQL: {sql} and input: {input} in {current} dialect"
 
 
@@ -388,8 +397,8 @@ def test_lowercased_input_sql_injection():
 
 def test_block_invalid_sql_queries():
     # These are invalid queries (e.g. unterminated strings) that fail tokenization
-    is_sql_injection("SELECT * FROM users WHERE id = 'users\\'", "users\\", "mysql")
-    is_sql_injection(
+    is_invalid_sql("SELECT * FROM users WHERE id = 'users\\'", "users\\", "mysql")
+    is_invalid_sql(
         "SELECT * FROM comments WHERE comment = 'I'm writting you'", "I'm writting you"
     )