Neo4j 从入门到精通：构建高效的图数据库解决方案_neo4j数据库

技术文档

一、引言：图数据库的崛起与 Neo4j 的核心价值

在大数据时代，数据之间的关联关系复杂度远超传统关系型数据库的处理能力。根据 Gartner 预测，到 2025 年，全球将有 30% 的企业采用图数据库来处理复杂关联数据，而 Neo4j 作为全球领先的图数据库，已被 Twitter、Adobe 等企业广泛应用。

1.1 传统数据库的困境

关系型数据库通过表结构和外键管理数据关联，但在处理社交网络、知识图谱等复杂场景时，会面临以下挑战：

性能瓶颈：多表 JOIN 操作随着数据量增长呈指数级变慢，例如查询 “Alice 的朋友的朋友” 需要多次 JOIN 关联表，时间复杂度达 O (n²)。
模型僵化：新增实体关系需修改表结构，如 “用户 - 购买 - 商品” 关系新增 “评价” 属性时，需新建关联表并迁移数据。
扩展性差：横向扩展时，数据分片导致关系断裂，难以维护全局一致性。

1.2 Neo4j 的革命性突破

Neo4j 采用原生图存储架构，将数据建模为节点（Node）、关系（Relationship）和属性（Property）的图结构，具有以下核心优势：

关系优先：关系作为一等公民存储，支持直接遍历，查询 “Alice 的朋友的朋友” 仅需一次路径匹配，时间复杂度 O (1)。
灵活建模：新增关系类型或属性无需修改模型，直接通过 Cypher 语句动态调整。
线性扩展：集群架构支持分布式存储，企业版可处理千亿级节点和关系。

1.3 应用场景与行业案例

Neo4j 在以下领域展现出独特价值：

推荐系统：通过用户 - 商品 - 标签的关系网络，实现个性化推荐，如电商平台的 “猜你喜欢”。
知识图谱：构建实体间的语义关联，如医疗领域的疾病 - 症状 - 药物知识网络。
欺诈检测：识别资金流向中的异常关系链，如跨境洗钱中的多层转账网络。

某金融机构通过 Neo4j 构建反欺诈系统，将交易风险识别效率提升 80%，误报率降低 60%。

二、Neo4j 核心概念与基础操作

2.1 数据模型：节点、关系与属性

2.1.1 节点（Node）

定义：表示实体，如用户、商品、地点。
属性：以键值对形式存储，如User {name: \"Alice\", age: 30}。
标签：分类节点类型，如:Person、:Product。

以下是创建节点的 Cypher 代码示例：

// 创建单个用户节点CREATE (u:User {name: \"Alice\", age: 30, email: \"alice@example.com\"})// 创建多个节点CREATE (:Product {name: \"iPhone\", price: 999.99, category: \"Electronics\"})CREATE (:City {name: \"New York\", population: 8500000, country: \"USA\"})

2.1.2 关系（Relationship）

定义：连接两个节点，具有方向和类型，如-[:FRIENDS_WITH]->。
属性：可存储关系特征，如-[:VISITED {date: \"2023-10-01\"}]->。
类型约束：通过唯一性约束确保关系类型的有效性。

以下是创建关系的 Cypher 代码示例：

// 创建用户之间的朋友关系MATCH (u1:User {name: \"Alice\"}), (u2:User {name: \"Bob\"})CREATE (u1)-[:FRIENDS_WITH {since: \"2020-01-01\"}]->(u2)// 创建用户访问城市的关系MATCH (u:User {name: \"Alice\"}), (c:City {name: \"New York\"})CREATE (u)-[:VISITED {date: \"2023-05-15\", duration: 5}]->(c)

2.1.3 属性（Property）

数据类型：支持字符串、数字、日期、数组等，如Product {price: 99.99, tags: [\"electronics\", \"smartphone\"]}。
索引优化：为高频查询属性创建索引，如CREATE INDEX ON :User(name)。

以下是操作属性的 Cypher 代码示例：

// 更新节点属性MATCH (u:User {name: \"Alice\"})SET u.age = 31, u.interests = [\"reading\", \"traveling\"]// 添加关系属性MATCH (u:User {name: \"Alice\"})-[r:VISITED]->(c:City {name: \"New York\"})SET r.rating = 4.5, r.review = \"Great city!\"// 删除属性MATCH (u:User {name: \"Alice\"})REMOVE u.interests

2.2 Cypher 查询语言基础

2.2.1 创建数据

以下是更丰富的创建数据示例：

// 创建多个节点并建立关系CREATE (p1:Person {name: \"Alice\", age: 30})CREATE (p2:Person {name: \"Bob\", age: 25})CREATE (p3:Person {name: \"Charlie\", age: 35})CREATE (p4:Person {name: \"David\", age: 28})// 创建节点间的复杂关系CREATE (p1)-[:FRIENDS_WITH]->(p2)CREATE (p1)-[:FRIENDS_WITH]->(p3)CREATE (p2)-[:WORKS_WITH]->(p4)CREATE (p3)-[:COLLEAGUE_OF]->(p4)CREATE (p1)-[:LIVES_IN {since: \"2015\"}]->(:City {name: \"London\"})CREATE (p2)-[:LIVES_IN {since: \"2018\"}]->(:City {name: \"Paris\"})CREATE (p3)-[:LIVES_IN {since: \"2017\"}]->(:City {name: \"London\"})CREATE (p4)-[:LIVES_IN {since: \"2020\"}]->(:City {name: \"Berlin\"})

2.2.2 查询数据

以下是各种查询场景的代码示例：

// 查询所有用户MATCH (u:User)RETURN u.name, u.ageORDER BY u.age DESC// 查询Alice的朋友MATCH (u:User {name: \"Alice\"})-[:FRIENDS_WITH]->(friend)RETURN friend.name AS friend_name// 查询住在London的用户及其朋友MATCH (u:User)-[:LIVES_IN]->(:City {name: \"London\"})-[:FRIENDS_WITH]->(friend)RETURN u.name AS user_name, friend.name AS friend_name// 查询路径长度为2的关系（朋友的朋友）MATCH (u:User {name: \"Alice\"})-[:FRIENDS_WITH*2]->(fof)RETURN DISTINCT fof.name AS friend_of_friend// 使用WHERE子句过滤查询MATCH (u:User)-[:LIVES_IN]->(c:City)WHERE c.name = \"London\" AND u.age > 30RETURN u.name, u.age, c.name// 聚合查询：统计每个城市的用户数量MATCH (u:User)-[:LIVES_IN]->(c:City)RETURN c.name AS city, COUNT(u) AS user_countORDER BY user_count DESC// 模式匹配：查找三角关系（A是B的朋友，B是C的朋友，C是A的朋友）MATCH (a:User)-[:FRIENDS_WITH]->(b:User)-[:FRIENDS_WITH]->(c:User)-[:FRIENDS_WITH]->(a:User)RETURN a.name, b.name, c.name

2.2.3 更新数据

以下是更新数据的更多示例：

// 批量更新节点属性MATCH (u:User)SET u.active = true, u.last_login = date()// 根据条件更新属性MATCH (u:User)-[:LIVES_IN]->(c:City)WHERE c.name = \"London\"SET u.country = \"UK\"// 添加新关系MATCH (u1:User {name: \"Alice\"}), (u2:User {name: \"David\"})MERGE (u1)-[r:KNOWS]->(u2)ON CREATE SET r.since = date(), r.introduction = \"Through Bob\"// 更新关系属性MATCH (u:User {name: \"Alice\"})-[r:FRIENDS_WITH]->(friend)WHERE friend.name = \"Bob\"SET r.strength = 0.8, r.updated_at = datetime()

2.2.4 删除数据

以下是安全删除数据的代码示例：

// 删除特定关系MATCH (u:User {name: \"Alice\"})-[r:FRIENDS_WITH]->(friend {name: \"Bob\"})DELETE r// 删除没有关系的孤立节点MATCH (n:User)WHERE NOT (n)--()DELETE n// 安全删除整个子图（先删除关系，再删除节点）MATCH (u:User {name: \"Charlie\"})-[r]->()DELETE rWITH uMATCH (u)<-[r]-()DELETE rWITH uDELETE u// 使用DETACH DELETE一次性删除节点及其所有关系（谨慎使用）MATCH (c:City {name: \"TestCity\"})DETACH DELETE c

2.3 数据导入与可视化

2.3.1 批量导入 CSV

以下是使用 LOAD CSV 命令导入数据的完整示例：

首先，准备用户数据文件users.csv：

id,name,age,email1,Alice,30,alice@example.com2,Bob,25,bob@example.com3,Charlie,35,charlie@example.com4,David,28,david@example.com

然后，准备关系数据文件friendships.csv：

user1_id,user2_id,since1,2,2020-01-011,3,2019-05-152,4,2021-10-203,4,2018-03-10

使用 Cypher 命令导入数据：

// 导入用户节点LOAD CSV WITH HEADERS FROM \"file:///users.csv\" AS rowMERGE (u:User {id: toInteger(row.id)})SET u.name = row.name, u.age = toInteger(row.age), u.email = row.email// 导入朋友关系LOAD CSV WITH HEADERS FROM \"file:///friendships.csv\" AS rowMATCH (u1:User {id: toInteger(row.user1_id)}), (u2:User {id: toInteger(row.user2_id)})MERGE (u1)-[r:FRIENDS_WITH]->(u2)SET r.since = date(row.since)

2.3.2 Neo4j Browser 可视化

界面导航：通过图形化界面执行 Cypher 查询，实时展示图结构。
路径分析：使用Graph Visualizer插件可视化复杂关系路径。

以下是一个可视化查询示例：

MATCH path = (u:User)-[r:FRIENDS_WITH*1..3]-(friend)WHERE u.name = \"Alice\"RETURN path

三、高级特性与企业级应用

3.1 事务处理与 ACID 保证

3.1.1 事务特性

原子性：一组操作要么全部成功，要么全部回滚。
一致性：事务执行前后数据状态保持一致。
隔离性：并发事务相互隔离，避免脏读、幻读。
持久性：事务提交后数据永久保存。

3.1.2 代码示例（Python 驱动）

以下是使用 Python 驱动执行事务的完整示例：

from neo4j import GraphDatabase, TRUST_ALL_CERTIFICATESfrom datetime import dateclass Neo4jService: def __init__(self, uri, user, password): self.driver = GraphDatabase.driver( uri, auth=(user, password), encrypted=False, trust=TRUST_ALL_CERTIFICATES ) def close(self): self.driver.close() def create_user(self, name, age, email): with self.driver.session() as session: result = session.execute_write(self._create_user, name, age, email) return result @staticmethod def _create_user(tx, name, age, email): query = ( \"MERGE (u:User {email: $email}) \" \"ON CREATE SET u.name = $name, u.age = $age, u.created_at = date() \" \"RETURN u.name AS name, u.email AS email\" ) result = tx.run(query, name=name, age=age, email=email) return result.single() def create_friendship(self, email1, email2, since): with self.driver.session() as session: result = session.execute_write(self._create_friendship, email1, email2, since) return result @staticmethod def _create_friendship(tx, email1, email2, since): query = ( \"MATCH (u1:User {email: $email1}), (u2:User {email: $email2}) \" \"MERGE (u1)-[r:FRIENDS_WITH]->(u2) \" \"ON CREATE SET r.since = $since, r.created_at = date() \" \"RETURN u1.name AS user1, u2.name AS user2, r.since AS since\" ) result = tx.run(query, email1=email1, email2=email2, since=since) return result.single() def get_friends(self, email): with self.driver.session() as session: result = session.execute_read(self._get_friends, email) return [record[\"friend_name\"] for record in result] @staticmethod def _get_friends(tx, email): query = ( \"MATCH (u:User {email: $email})-[:FRIENDS_WITH]->(f:User) \" \"RETURN f.name AS friend_name\" ) result = tx.run(query, email=email) return result.values()# 使用示例if __name__ == \"__main__\": neo4j_service = Neo4jService(\"bolt://localhost:7687\", \"neo4j\", \"password\") # 创建用户 user1 = neo4j_service.create_user(\"Alice\", 30, \"alice@example.com\") user2 = neo4j_service.create_user(\"Bob\", 25, \"bob@example.com\") # 创建友谊关系 friendship = neo4j_service.create_friendship( \"alice@example.com\", \"bob@example.com\", date(2020, 1, 1) ) # 查询朋友 friends = neo4j_service.get_friends(\"alice@example.com\") print(f\"Alice\'s friends: {friends}\") neo4j_service.close()

3.2 索引与约束优化查询

3.2.1 索引类型

节点标签属性索引：CREATE INDEX ON :User(name)。
全文索引：CALL db.index.fulltext.createNodeIndex(\"productIndex\", [\"Product\"], [\"name\", \"description\"])。
复合索引：CREATE INDEX ON :User(name, age)。

以下是创建和使用各种索引的完整示例：

// 创建简单属性索引CREATE INDEX ON :User(email)// 创建复合索引CREATE INDEX ON :Product(name, category)// 创建全文索引CALL db.index.fulltext.createNodeIndex( \"productSearch\", [\"Product\"], [\"name\", \"description\", \"keywords\"])// 使用全文索引查询CALL db.index.fulltext.queryNodes(\"productSearch\", \"smartphone\")YIELD node, scoreRETURN node.name, node.price, scoreORDER BY score DESC// 查看查询计划，验证索引使用EXPLAIN MATCH (p:Product {category: \"Electronics\", price: 999.99})RETURN p.name, p.description

3.2.2 唯一性约束

// 创建唯一性约束CREATE CONSTRAINT ON (u:User) ASSERT u.email IS UNIQUE// 创建节点键约束（要求属性存在且唯一）CREATE CONSTRAINT ON (p:Product) ASSERT (p.sku) IS NODE KEY// 验证约束CREATE (:User {email: \"test@example.com\"})CREATE (:User {email: \"test@example.com\"}) // 会失败，因为违反唯一性约束

3.3 分布式架构与高可用性

3.3.1 因果集群（Causal Cluster）

架构设计：多核心节点（Core）和只读副本（Read Replica）组成，支持自动故障转移。
数据同步：通过 Raft 协议实现强一致性，数据复制延迟低于 50ms。

以下是因果集群的配置示例：

核心节点 1 配置（neo4j.conf）：

dbms.mode=COREcausal_clustering.initial_discovery_members=core1:5000,core2:5000,core3:5000dbms.default_database=graph.dbdbms.connector.bolt.enabled=truedbms.connector.bolt.listen_address=:7687dbms.connector.http.enabled=truedbms.connector.http.listen_address=:7474dbms.connector.https.enabled=truedbms.connector.https.listen_address=:7473dbms.security.procedures.unrestricted=gds.*

只读副本配置：

dbms.mode=READ_REPLICAcausal_clustering.initial_discovery_members=core1:5000,core2:5000,core3:5000dbms.default_database=graph.dbdbms.connector.bolt.enabled=truedbms.connector.bolt.listen_address=:7687dbms.connector.http.enabled=truedbms.connector.http.listen_address=:7474dbms.connector.https.enabled=truedbms.connector.https.listen_address=:7473

3.3.2 企业版集群部署

# 在每个核心节点上执行初始化命令neo4j-admin server upgrade# 启动核心节点neo4j start# 添加只读副本neo4j-admin database copy --from=core1:6362 --to=replica1:6362 graph.db

3.4 图算法与数据分析

3.4.1 内置算法库（GDS）

最短路径：CALL gds.shortestPath.dijkstra.stream({nodeQuery: \"MATCH (n:City) RETURN id(n) AS id\", relationshipQuery: \"MATCH (n)-[r:ROUTE]->(m) RETURN id(n) AS source, id(m) AS target, r.distance AS weight\"})。
社区发现：CALL gds.louvain.stream({nodeProjection: \"User\", relationshipProjection: {FRIEND_OF: {type: \"FRIEND_OF\", orientation: \"UNDIRECTED\"}}})。
中心性分析：CALL gds.pageRank.stream({nodeProjection: \"User\", relationshipProjection: \"FRIEND_OF\"})。

以下是使用图数据科学库（GDS）的完整示例：

首先，准备一个社交网络图：

// 创建社交网络示例数据CREATE (u1:User {name: \"Alice\"}), (u2:User {name: \"Bob\"}), (u3:User {name: \"Charlie\"}), (u4:User {name: \"David\"}), (u5:User {name: \"Eve\"}), (u6:User {name: \"Frank\"}), (u7:User {name: \"Grace\"}), (u8:User {name: \"Heidi\"}), (u9:User {name: \"Ivan\"}), (u10:User {name: \"Judy\"})// 添加友谊关系CREATE (u1)-[:FRIEND_OF]->(u2), (u1)-[:FRIEND_OF]->(u3), (u2)-[:FRIEND_OF]->(u4), (u3)-[:FRIEND_OF]->(u4), (u4)-[:FRIEND_OF]->(u5), (u5)-[:FRIEND_OF]->(u6), (u6)-[:FRIEND_OF]->(u7), (u7)-[:FRIEND_OF]->(u8), (u8)-[:FRIEND_OF]->(u9), (u9)-[:FRIEND_OF]->(u10), (u10)-[:FRIEND_OF]->(u1)

执行 PageRank 算法分析节点重要性：

// 加载GDS并创建图投影CALL gds.graph.project( \'socialGraph\', \'User\', \'FRIEND_OF\')// 执行PageRank算法CALL gds.pageRank.stream(\'socialGraph\')YIELD nodeId, scoreRETURN gds.util.asNode(nodeId).name AS user, scoreORDER BY score DESC

执行社区发现（Louvain 算法）：

// 执行Louvain算法CALL gds.louvain.stream(\'socialGraph\')YIELD nodeId, communityIdRETURN gds.util.asNode(nodeId).name AS user, communityIdORDER BY communityId, user

3.4.2 APOC 扩展库

// 生成随机图数据CALL apoc.generate.graph(100, \"User\", \"Friend\", 3)// 数据转换RETURN apoc.convert.toJson({name: \"Alice\", age: 30})// 路径搜索MATCH path = (u:User {name: \"Alice\"})-[*..4]-(target)WHERE target.name = \"Bob\"RETURN path// 批量更新UNWIND range(1, 1000) AS idCREATE (:User {id: id, name: \"User\" + id, age: apoc.math.random(18, 65)})

四、性能优化与运维管理

4.1 性能调优策略

4.1.1 内存配置

# neo4j.confdbms.memory.heap.initial_size=4gdbms.memory.heap.max_size=8gdbms.memory.pagecache.size=16gdbms.memory.transaction.global_max_size=2g

4.1.2 查询计划分析

// 查看查询执行计划EXPLAIN MATCH (u:User)-[:FRIENDS_WITH*2..3]->(friend)WHERE u.name = \"Alice\"RETURN friend.name, count(*) AS friend_count// 使用PROFILE获取详细性能数据PROFILE MATCH (u:User)-[:LIVES_IN]->(c:City)<-[:LIVES_IN]-(neighbor)WHERE u.name = \"Alice\"RETURN neighbor.name, c.name

4.1.3 批量操作优化

// 使用USING PERIODIC COMMIT分批处理大量数据USING PERIODIC COMMIT 1000LOAD CSV WITH HEADERS FROM \"file:///large_users.csv\" AS rowMERGE (u:User {id: row.id})SET u.name = row.name, u.age = toInteger(row.age)// 并行导入数据（使用APOC）CALL apoc.periodic.iterate( \"MATCH (u:User) WHERE u.age > 30 RETURN u\", \"MATCH (u)-[:FRIENDS_WITH]->(f) WHERE f.age > 30 CREATE (u)-[:OLD_FRIENDS]->(f)\", {batchSize:1000, parallel:true})

4.2 监控与日志管理

4.2.1 Prometheus 集成

# neo4j.confmetrics.prometheus.enabled=truemetrics.prometheus.endpoint=0.0.0.0:2004metrics.namespaces.enabled=true

Prometheus 配置文件prometheus.yml：

scrape_configs: - job_name: \'neo4j\' static_configs: - targets: [\'localhost:2004\']

4.2.2 Grafana 可视化

关键指标：页面缓存命中率、事务吞吐量、GC 停顿时间。
告警规则：设置查询响应时间超过 500ms 时触发警报。

以下是使用 Python 获取 Neo4j 监控数据的示例：

import requestsimport json# 获取Prometheus指标response = requests.get(\'http://localhost:9090/api/v1/query\', params={\'query\': \'neo4j_kernel_transaction_commit_total\'})# 解析JSON响应data = json.loads(response.text)# 处理指标数据for result in data[\'data\'][\'result\']: print(f\"Metric: {result[\'metric\']}\") print(f\"Value: {result[\'value\']}\")

4.3 备份与恢复

4.3.1 在线备份

# 全量备份neo4j-admin backup --from=core1:6362 --to=/backup/neo4j-backup --name=full_backup_$(date +%Y%m%d)# 增量备份neo4j-admin backup --from=core1:6362 --to=/backup/neo4j-backup --name=incr_backup_$(date +%Y%m%d) --incremental

4.3.2 恢复操作

# 停止Neo4j服务neo4j stop# 恢复数据库neo4j-admin restore --from=/backup/neo4j-backup/full_backup_20230101 --database=graph.db --force# 启动Neo4j服务neo4j start

五、实战案例：构建知识图谱智能问答系统

5.1 需求分析

目标：基于医疗知识图谱实现症状 - 疾病 - 药物的智能问答。
数据来源：结构化病历数据、医学文献、药品说明书。

5.2 数据建模

// 创建疾病节点CREATE (:Disease {id: \"D001\", name: \"肺炎\", type: \"呼吸系统疾病\", icd10: \"J18\"})CREATE (:Disease {id: \"D002\", name: \"高血压\", type: \"心血管疾病\", icd10: \"I10\"})CREATE (:Disease {id: \"D003\", name: \"糖尿病\", type: \"代谢性疾病\", icd10: \"E11\"})// 创建症状节点CREATE (:Symptom {id: \"S001\", name: \"咳嗽\", severity: 3})CREATE (:Symptom {id: \"S002\", name: \"发热\", severity: 4})CREATE (:Symptom {id: \"S003\", name: \"头痛\", severity: 2})CREATE (:Symptom {id: \"S004\", name: \"乏力\", severity: 3})CREATE (:Symptom {id: \"S005\", name: \"多饮\", severity: 2})CREATE (:Symptom {id: \"S006\", name: \"多尿\", severity: 2})// 创建药物节点CREATE (:Medicine {id: \"M001\", name: \"阿莫西林\", type: \"抗生素\", category: \"青霉素类\"})CREATE (:Medicine {id: \"M002\", name: \"布洛芬\", type: \"解热镇痛药\", category: \"非甾体抗炎药\"})CREATE (:Medicine {id: \"M003\", name: \"硝苯地平\", type: \"降压药\", category: \"钙通道阻滞剂\"})CREATE (:Medicine {id: \"M004\", name: \"二甲双胍\", type: \"降糖药\", category: \"双胍类\"})// 建立疾病-症状关系MATCH (d:Disease {name: \"肺炎\"}), (s:Symptom {name: \"咳嗽\"}) CREATE (d)-[:HAS_SYMPTOM {probability: 0.8}]->(s)MATCH (d:Disease {name: \"肺炎\"}), (s:Symptom {name: \"发热\"}) CREATE (d)-[:HAS_SYMPTOM {probability: 0.9}]->(s)MATCH (d:Disease {name: \"高血压\"}), (s:Symptom {name: \"头痛\"}) CREATE (d)-[:HAS_SYMPTOM {probability: 0.3}]->(s)MATCH (d:Disease {name: \"糖尿病\"}), (s:Symptom {name: \"多饮\"}) CREATE (d)-[:HAS_SYMPTOM {probability: 0.7}]->(s)MATCH (d:Disease {name: \"糖尿病\"}), (s:Symptom {name: \"多尿\"}) CREATE (d)-[:HAS_SYMPTOM {probability: 0.8}]->(s)// 建立疾病-药物关系MATCH (d:Disease {name: \"肺炎\"}), (m:Medicine {name: \"阿莫西林\"}) CREATE (d)-[:TREATMENT_OPTION {effectiveness: 0.9}]->(m)MATCH (d:Disease {name: \"肺炎\"}), (m:Medicine {name: \"布洛芬\"}) CREATE (d)-[:TREATMENT_OPTION {effectiveness: 0.7}]->(m)MATCH (d:Disease {name: \"高血压\"}), (m:Medicine {name: \"硝苯地平\"}) CREATE (d)-[:TREATMENT_OPTION {effectiveness: 0.85}]->(m)MATCH (d:Disease {name: \"糖尿病\"}), (m:Medicine {name: \"二甲双胍\"}) CREATE (d)-[:TREATMENT_OPTION {effectiveness: 0.9}]->(m)

5.3 问答逻辑实现

以下是使用 Python 实现的智能问答系统代码：

from neo4j import GraphDatabaseimport reclass MedicalKGQA: def __init__(self, uri, user, password): self.driver = GraphDatabase.driver(uri, auth=(user, password)) def close(self): self.driver.close() def get_diseases_by_symptom(self, symptom_name): with self.driver.session() as session: result = session.execute_read(self._get_diseases_by_symptom, symptom_name) return result @staticmethod def _get_diseases_by_symptom(tx, symptom_name): query = ( \"MATCH (d:Disease)-[r:HAS_SYMPTOM]->(s:Symptom {name: $symptom_name}) \" \"RETURN d.name AS disease, r.probability AS probability \" \"ORDER BY probability DESC\" ) result = tx.run(query, symptom_name=symptom_name) return [(record[\"disease\"], record[\"probability\"]) for record in result] def get_treatments_by_disease(self, disease_name): with self.driver.session() as session: result = session.execute_read(self._get_treatments_by_disease, disease_name) return result @staticmethod def _get_treatments_by_disease(tx, disease_name): query = ( \"MATCH (d:Disease {name: $disease_name})-[r:TREATMENT_OPTION]->(m:Medicine) \" \"RETURN m.name AS medicine, m.type AS type, r.effectiveness AS effectiveness \" \"ORDER BY effectiveness DESC\" ) result = tx.run(query, disease_name=disease_name) return [(record[\"medicine\"], record[\"type\"], record[\"effectiveness\"]) for record in result] def answer_question(self, question): # 简单的模式匹配，识别症状和疾病 symptom_pattern = r\"症状|表现|sign|symptom\" disease_pattern = r\"疾病|病|disease|illness\" treatment_pattern = r\"治疗|药|药物|治疗方法|medicine|treatment\" # 症状查询 if re.search(symptom_pattern, question, re.IGNORECASE): # 提取症状名称 symptom_match = re.search(r\"是(.*)的症状\", question) if symptom_match: symptom_name = symptom_match.group(1).strip() diseases = self.get_diseases_by_symptom(symptom_name) if diseases:  response = f\"{symptom_name}可能是以下疾病的症状：\\n\"  for disease, probability in diseases: response += f\"- {disease}（可能性：{probability*100:.1f}%）\\n\"  return response else:  return f\"抱歉，未找到与\'{symptom_name}\'相关的疾病。\" # 治疗方法查询 elif re.search(treatment_pattern, question, re.IGNORECASE): # 提取疾病名称 disease_match = re.search(r\"治疗(.*)的药\", question) if not disease_match: disease_match = re.search(r\"(.*)如何治疗\", question) if disease_match: disease_name = disease_match.group(1).strip() treatments = self.get_treatments_by_disease(disease_name) if treatments:  response = f\"治疗{disease_name}的常用药物包括：\\n\"  for medicine, med_type, effectiveness in treatments: response += f\"- {medicine}（{med_type}，有效率：{effectiveness*100:.1f}%）\\n\"  return response else:  return f\"抱歉，未找到治疗\'{disease_name}\'的药物信息。\" # 疾病查询（如\"什么是高血压\"） elif re.search(disease_pattern, question, re.IGNORECASE): # 提取疾病名称 disease_match = re.search(r\"什么是(.*)\", question) if disease_match: disease_name = disease_match.group(1).strip() # 这里可以实现查询疾病详细信息的逻辑 return f\"{disease_name}是一种{self._get_disease_type(disease_name)}疾病。\\n\" \\ f\"常见症状包括：{self._get_disease_symptoms(disease_name)}\\n\" \\ f\"治疗方法包括：{self._get_disease_treatments(disease_name)}\" return \"抱歉，我不理解这个问题。请尝试以\'什么是XX疾病\'、\'XX是哪些疾病的症状\'或\'如何治疗XX疾病\'的形式提问。\" def _get_disease_type(self, disease_name): # 简化实现，实际应查询数据库 return \"常见\" def _get_disease_symptoms(self, disease_name): # 简化实现，实际应查询数据库 symptoms = self.get_diseases_by_symptom(disease_name) return \", \".join([symptom[0] for symptom in symptoms]) def _get_disease_treatments(self, disease_name): # 简化实现，实际应查询数据库 treatments = self.get_treatments_by_disease(disease_name) return \", \".join([treatment[0] for treatment in treatments])# 使用示例if __name__ == \"__main__\": kgqa = MedicalKGQA(\"bolt://localhost:7687\", \"neo4j\", \"password\") questions = [ \"咳嗽是哪些疾病的症状？\", \"如何治疗肺炎？\", \"什么是糖尿病？\" ] for question in questions: print(f\"问题：{question}\") print(f\"回答：{kgqa.answer_question(question)}\\n\") kgqa.close()

六、总结与展望

Neo4j 作为图数据库的标杆，正在重塑数据管理的未来。通过本文的学习，读者可掌握从基础操作到企业级部署的全流程知识，并在实际项目中发挥其强大的图处理能力。随着数据关联复杂度的持续增长，Neo4j 的应用场景将不断扩展，成为数字化转型的核心技术之一。

参考文献

Neo4j 官方文档（Neo4j documentation - Neo4j Documentation）
GraphDatabase 社区博客（Neo4j Online Community）
《图数据库实战》（作者：Subramanian Lakshmanan）
Neo4j 技术白皮书（Graph Database Resources: White Papers, Case Studies & More）