Greifen Sie mit Python über ODBC oder JDBC auf die IRIS-Datenbank zu

Titelseite > Programmierung > Greifen Sie mit Python über ODBC oder JDBC auf die IRIS-Datenbank zu

Greifen Sie mit Python über ODBC oder JDBC auf die IRIS-Datenbank zu

Veröffentlicht am 15.11.2024

Durchsuche:277

Access IRIS database with ODBC or JDBC using Python

Probleme mit Strings

Ich greife mit Python auf IRIS-Datenbanken mit JDBC (oder ODBC) zu. Ich möchte die Daten in einen pandas-Datenrahmen abrufen, um die Daten zu bearbeiten und daraus Diagramme zu erstellen. Bei der Verwendung von JDBC ist ein Problem mit der String-Verarbeitung aufgetreten. Dieser Beitrag soll helfen, falls jemand anderes die gleichen Probleme hat. Oder wenn es einen einfacheren Weg gibt, dieses Problem zu lösen, lassen Sie es mich in den Kommentaren wissen!

Ich verwende OSX und bin mir daher nicht sicher, wie einzigartig mein Problem ist. Ich verwende Jupyter Notebooks, obwohl der Code im Allgemeinen derselbe wäre, wenn Sie ein anderes Python-Programm oder Framework verwenden würden.

Das JDBC-Problem

Wenn ich Daten aus der Datenbank abrufe, werden die Spaltenbeschreibungen und alle Zeichenfolgendaten als Datentyp java.lang.String zurückgegeben. Wenn Sie Zeichenfolgendaten drucken, sieht das so aus: „(p,a,i,n,i,n,t,h,e,r,e,a,r)“ anstelle des erwarteten „painintherear“.

Dies liegt wahrscheinlich daran, dass Zeichenfolgen des Datentyps java.lang.String beim Abrufen mit JDBC als Iterable oder Array durchkommen. Dies kann passieren, wenn die von Ihnen verwendete Python-Java-Brücke (z. B. JayDeBeApi, JDBC) java.lang.String nicht automatisch in einem einzigen Schritt in einen Python-String konvertiert.

Pythons str-String-Darstellung hingegen hat den gesamten String als eine einzige Einheit. Wenn Python einen normalen String abruft (z. B. über ODBC), wird dieser nicht in einzelne Zeichen aufgeteilt.

Die JDBC-Lösung

Um dieses Problem zu beheben, müssen Sie sicherstellen, dass java.lang.String korrekt in den str-Typ von Python konvertiert wird. Sie können diese Konvertierung explizit bei der Verarbeitung der abgerufenen Daten verarbeiten, sodass sie nicht als iterierbare Datei oder Zeichenliste interpretiert wird.

Es gibt viele Möglichkeiten, diese Zeichenfolgenmanipulation durchzuführen; Das habe ich getan.

import pandas as pd

import pyodbc

import jaydebeapi
import jpype

def my_function(jdbc_used)

    # Some other code to create the connection goes here

    cursor.execute(query_string)

    if jdbc_used:
        # Fetch the results, convert java.lang.String in the data to Python str
        # (java.lang.String is returned "(p,a,i,n,i,n,t,h,e,r,e,a,r)" Convert to str type "painintherear"
        results = []
        for row in cursor.fetchall():
            converted_row = [str(item) if isinstance(item, jpype.java.lang.String) else item for item in row]
            results.append(converted_row)

        # Get the column names and ensure they are Python strings 
        column_names = [str(col[0]) for col in cursor.description]

        # Create the dataframe
        df = pd.DataFrame.from_records(results, columns=column_names)

        # Check the results
        print(df.head().to_string())

    else:  
        # I was also testing ODBC
        # For very large result sets get results in chunks using cursor.fetchmany(). or fetchall()
        results = cursor.fetchall()
        # Get the column names
        column_names = [column[0] for column in cursor.description]
        # Create the dataframe
        df = pd.DataFrame.from_records(results, columns=column_names)

    # Do stuff with your dataframe

Das ODBC-Problem

Bei Verwendung einer ODBC-Verbindung werden Zeichenfolgen nicht zurückgegeben oder sind NA.

Wenn Sie eine Verbindung zu einer Datenbank herstellen, die Unicode-Daten (z. B. Namen in verschiedenen Sprachen) enthält, oder wenn Ihre Anwendung Nicht-ASCII-Zeichen speichern oder abrufen muss, müssen Sie sicherstellen, dass die Daten bei der Weitergabe zwischen den korrekt codiert bleiben Datenbank und Ihrer Python-Anwendung.

Die ODBC-Lösung

Dieser Code stellt sicher, dass Zeichenfolgendaten beim Senden und Abrufen von Daten an die Datenbank mithilfe von UTF-8 codiert und decodiert werden. Dies ist besonders wichtig, wenn Sie mit Nicht-ASCII-Zeichen arbeiten oder die Kompatibilität mit Unicode-Daten sicherstellen.

def create_connection(connection_string, password):
    connection = None

    try:
        # print(f"Connecting to {connection_string}")
        connection = pyodbc.connect(connection_string   ";PWD="   password)

        # Ensure strings are read correctly
        connection.setdecoding(pyodbc.SQL_CHAR, encoding="utf8")
        connection.setdecoding(pyodbc.SQL_WCHAR, encoding="utf8")
        connection.setencoding(encoding="utf8")

    except pyodbc.Error as e:
        print(f"The error '{e}' occurred")

    return connection

connection.setdecoding(pyodbc.SQL_CHAR, binding="utf8")

Teilt pyodbc mit, wie Zeichendaten aus der Datenbank dekodiert werden sollen, wenn SQL_CHAR-Typen abgerufen werden (normalerweise Zeichenfelder mit fester Länge).

connection.setdecoding(pyodbc.SQL_WCHAR, binding="utf8")

Legt die Dekodierung für SQL_WCHAR-Breitzeichentypen fest (d. h. Unicode-Zeichenfolgen wie NVARCHAR oder NCHAR in SQL Server).

connection.setencoding(encoding="utf8")

Stellt sicher, dass alle von Python an die Datenbank gesendeten Zeichenfolgen oder Zeichendaten mit UTF-8 codiert werden,
Das bedeutet, dass Python seinen internen str-Typ (der Unicode ist) bei der Kommunikation mit der Datenbank in UTF-8-Bytes übersetzt.

Alles zusammenfügen

Installieren Sie JDBC

JAVA installieren – dmg verwenden

https://www.oracle.com/middleeast/java/technologies/downloads/#jdk23-mac

Shell aktualisieren, um die Standardversion festzulegen

$ /usr/libexec/java_home -V
Matching Java Virtual Machines (2):
    23 (arm64) "Oracle Corporation" - "Java SE 23" /Library/Java/JavaVirtualMachines/jdk-23.jdk/Contents/Home
    1.8.421.09 (arm64) "Oracle Corporation" - "Java" /Library/Internet Plug-Ins/JavaAppletPlugin.plugin/Contents/Home
/Library/Java/JavaVirtualMachines/jdk-23.jdk/Contents/Home
$ echo $SHELL
/opt/homebrew/bin/bash
$ vi ~/.bash_profile

Fügen Sie JAVA_HOME zu Ihrem Pfad hinzu

export JAVA_HOME=$(/usr/libexec/java_home -v 23)
export PATH=$JAVA_HOME/bin:$PATH

Holen Sie sich den JDBC-Treiber

https://intersystems-community.github.io/iris-driver-distribution/

Legen Sie die JAR-Datei irgendwo ab... Ich habe sie in $HOME abgelegt

$ ls $HOME/*.jar
/Users/myname/intersystems-jdbc-3.8.4.jar

Beispielcode

Es wird davon ausgegangen, dass Sie ODBC eingerichtet haben (ein Beispiel für einen anderen Tag, der Hund hat meine Notizen gefressen...).

Hinweis: Dies ist ein Hack meines echten Codes. Beachten Sie die Variablennamen.

import os

import datetime
from datetime import date, time, datetime, timedelta

import pandas as pd
import pyodbc

import jaydebeapi
import jpype

def jdbc_create_connection(jdbc_url, jdbc_username, jdbc_password):

    # Path to JDBC driver
    jdbc_driver_path = '/Users/yourname/intersystems-jdbc-3.8.4.jar'

    # Ensure JAVA_HOME is set
    os.environ['JAVA_HOME']='/Library/Java/JavaVirtualMachines/jdk-23.jdk/Contents/Home'
    os.environ['CLASSPATH'] = jdbc_driver_path

    # Start the JVM (if not already running)
    if not jpype.isJVMStarted():
        jpype.startJVM(jpype.getDefaultJVMPath(), classpath=[jdbc_driver_path])

    # Connect to the database
    connection = None

    try:
        connection = jaydebeapi.connect("com.intersystems.jdbc.IRISDriver",
                                  jdbc_url,
                                  [jdbc_username, jdbc_password],
                                  jdbc_driver_path)
        print("Connection successful")
    except Exception as e:
        print(f"An error occurred: {e}")

    return connection


def odbc_create_connection(connection_string):
    connection = None

    try:
        # print(f"Connecting to {connection_string}")
        connection = pyodbc.connect(connection_string)

        # Ensure strings are read correctly
        connection.setdecoding(pyodbc.SQL_CHAR, encoding="utf8")
        connection.setdecoding(pyodbc.SQL_WCHAR, encoding="utf8")
        connection.setencoding(encoding="utf8")

    except pyodbc.Error as e:
        print(f"The error '{e}' occurred")

    return connection

# Parameters

odbc_driver = "InterSystems ODBC"
odbc_host = "your_host"
odbc_port = "51773"
odbc_namespace = "your_namespace"
odbc_username = "username"
odbc_password = "password"

jdbc_host = "your_host"
jdbc_port = "51773"
jdbc_namespace = "your_namespace"
jdbc_username = "username"
jdbc_password = "password"

# Create connection and create charts

jdbc_used = True

if jdbc_used:
    print("Using JDBC")
    jdbc_url = f"jdbc:IRIS://{jdbc_host}:{jdbc_port}/{jdbc_namespace}?useUnicode=true&characterEncoding=UTF-8"
    connection = jdbc_create_connection(jdbc_url, jdbc_username, jdbc_password)
else:
    print("Using ODBC")
    connection_string = f"Driver={odbc_driver};Host={odbc_host};Port={odbc_port};Database={odbc_namespace};UID={odbc_username};PWD={odbc_password}"
    connection = odbc_create_connection(connection_string)


if connection is None:
    print("Unable to connect to IRIS")
    exit()

cursor = connection.cursor()

site = "SAMPLE"
table_name = "your.TableNAME"

desired_columns = [
    "RunDate",
    "ActiveUsersCount",
    "EpisodeCountEmergency",
    "EpisodeCountInpatient",
    "EpisodeCountOutpatient",
    "EpisodeCountTotal",
    "AppointmentCount",
    "PrintCountTotal",
    "site",
]

# Construct the column selection part of the query
column_selection = ", ".join(desired_columns)

query_string = f"SELECT {column_selection} FROM {table_name} WHERE Site = '{site}'"

print(query_string)
cursor.execute(query_string)

if jdbc_used:
    # Fetch the results
    results = []
    for row in cursor.fetchall():
        converted_row = [str(item) if isinstance(item, jpype.java.lang.String) else item for item in row]
        results.append(converted_row)

    # Get the column names and ensure they are Python strings (java.lang.String is returned "(p,a,i,n,i,n,t,h,e,a,r,s,e)"
    column_names = [str(col[0]) for col in cursor.description]

    # Create the dataframe
    df = pd.DataFrame.from_records(results, columns=column_names)
    print(df.head().to_string())
else:
    # For very large result sets get results in chunks using cursor.fetchmany(). or fetchall()
    results = cursor.fetchall()
    # Get the column names
    column_names = [column[0] for column in cursor.description]
    # Create the dataframe
    df = pd.DataFrame.from_records(results, columns=column_names)

    print(df.head().to_string())

# # Build charts for a site
# cf.build_7_day_rolling_average_chart(site, cursor, jdbc_used)

cursor.close()
connection.close()

# Shutdown the JVM (if you started it)
# jpype.shutdownJVM()

Freigabeerklärung Dieser Artikel ist abgedruckt unter: https://dev.to/intersystems/access-iris-database-with-odbc-or-jdbc-using-python-54ok?1 Bei Verstößen wenden Sie sich bitte an [email protected] um es zu löschen

Neuestes Tutorial Mehr>

Jenseits von „if“-Anweisungen: Wo sonst kann ein Typ mit einer expliziten „bool“-Konvertierung ohne Umwandlung verwendet werden?
Kontextuelle Konvertierung in bool ohne Umwandlung zulässigIhre Klasse definiert eine explizite Konvertierung in bool, sodass Sie ihre Instanz „t“ dir...

Programmierung Veröffentlicht am 16.11.2024
Was ist mit dem Spaltenversatz in Bootstrap 4 Beta passiert?
Bootstrap 4 Beta: Die Entfernung und Wiederherstellung des SpaltenversatzesBootstrap 4 führte in seiner Beta-1-Version wesentliche Änderungen an der A...

Programmierung Veröffentlicht am 16.11.2024
Wie kombiniere ich zwei assoziative Arrays in PHP und behalte dabei eindeutige IDs bei und verarbeite doppelte Namen?
Kombinieren assoziativer Arrays in PHPIn PHP ist das Kombinieren zweier assoziativer Arrays zu einem einzigen Array eine häufige Aufgabe. Betrachten S...

Programmierung Veröffentlicht am 16.11.2024
Verwendung von WebSockets in Go für Echtzeitkommunikation
Das Erstellen von Apps, die Echtzeit-Updates erfordern – wie Chat-Anwendungen, Live-Benachrichtigungen oder Tools für die Zusammenarbeit – erfordert e...

Programmierung Veröffentlicht am 16.11.2024
Wie kann ich mit MySQL Benutzer mit den heutigen Geburtstagen finden?
So identifizieren Sie Benutzer mit den heutigen Geburtstagen mithilfe von MySQLUm mithilfe von MySQL festzustellen, ob heute der Geburtstag eines Benu...

Programmierung Veröffentlicht am 16.11.2024
Wie behebt man „Unsachgemäß konfiguriert: Fehler beim Laden des MySQLdb-Moduls“ in Django unter macOS?
MySQL falsch konfiguriert: Das Problem mit relativen PfadenBeim Ausführen von python manage.py runserver in Django kann der folgende Fehler auftreten:...

Programmierung Veröffentlicht am 16.11.2024
Warum unterscheidet sich die Gleitkomma-Arithmetik zwischen x86 und x64 in Visual Studio 2010?
Gleitkomma-Arithmetik-Diskrepanz zwischen x86 und x64In Visual Studio 2010 gibt es einen spürbaren Unterschied in der Gleitkomma-Arithmetik zwischen x...

Programmierung Veröffentlicht am 15.11.2024
Wie kann ich die Leistung des MySQL-LIKE-Operators mit Platzhaltern verbessern?
MySQL LIKE-Operator-OptimierungFrage: Kann die Leistung des MySQL LIKE-Operators verbessert werden, wenn Platzhalter verwendet werden (z. B. „%test%“)...

Programmierung Veröffentlicht am 15.11.2024
Wie kann ich mit PHP Daten per POST an eine externe Website senden?
Umleiten und Senden von Daten per POST in PHPIn PHP kann es vorkommen, dass Sie einen Benutzer an einen externen Benutzer umleiten müssen Website und ...

Programmierung Veröffentlicht am 15.11.2024
Wie kann ich mithilfe von GCC Segmentierungsfehler in Linux erkennen?
Abfangen von Segmentierungsfehlern unter LinuxF: Ich erlebe Segmentierungsfehler in einer Bibliothek eines Drittanbieters, kann dies aber nicht das zu...

Programmierung Veröffentlicht am 15.11.2024
Wie kann ich auf den Typ einer Go-Struktur zugreifen, ohne eine Instanz zu erstellen?
Zugriff auf Reflect.Type ohne physische StrukturerstellungIn Go erfordert das dynamische Laden von Problemlösungen den Zugriff auf die Art von Struktu...

Programmierung Veröffentlicht am 15.11.2024
Wie konvertiert man Ganzzahlen in Java effizient in Byte-Arrays?
Effiziente Konvertierung von Ganzzahlen in Byte-Arrays in JavaDie Konvertierung einer Ganzzahl in ein Byte-Array kann für verschiedene Zwecke nützlich...

Programmierung Veröffentlicht am 15.11.2024
Wie sortiere ich ein Segment von Strukturen nach mehreren Feldern in Go?
Slice-Objekte nach mehreren Feldern sortierenSortierung nach mehreren KriterienBerücksichtigen Sie die folgenden übergeordneten und untergeordneten St...

Programmierung Veröffentlicht am 15.11.2024
Qt-Threads vs. Python-Threads: Welche sollte ich in PyQt-Anwendungen verwenden?
Threading in PyQt-Anwendungen: Qt-Threads vs. Python-ThreadsEntwickler, die reaktionsfähige GUI-Anwendungen mit PyQt erstellen möchten, stehen häufig ...

Programmierung Veröffentlicht am 15.11.2024
Warum löst meine PHP-Senden-Schaltfläche keine Echos und keine Tabellenanzeige aus?
PHP-Senden-Schaltflächen-Dilemma: Nicht verfügbare Echos und TabelleIhr Code beabsichtigt, Echos und eine Tabelle anzuzeigen, wenn auf die Schaltfläch...

Programmierung Veröffentlicht am 15.11.2024

Einstufung Mehr>

Japanisch lernen Koreanisch lernen Chinesisch lernen Fremdsprache lernen Spiel Häufiges Problem Technologie-Peripheriegeräte KI Software-Tutorial Programmierung Artikel