# -*- coding: utf-8 -*-
"""
综合评估报告

汇总所有测试结果，生成TaskQueueManager核心逻辑健壮性的综合评估
"""

import os
import sys
import subprocess
import json
from datetime import datetime

# 添加项目根目录到路径
sys.path.append(os.path.dirname(os.path.abspath(__file__)))

# 设置测试环境变量
os.environ['ARK_API_KEY'] = 'test_api_key_for_testing'
os.environ['ARK_BASE_URL'] = 'https://test.api.com'

class ComprehensiveAssessment:
    """综合评估类"""
    
    def __init__(self):
        self.test_results = {
            'basic_functionality': None,
            'robustness': None,
            'stress_performance': None
        }
        self.assessment_time = datetime.now()
    
    def run_basic_tests(self):
        """运行基础功能测试"""
        print("=== 运行基础功能测试 ===")
        try:
            result = subprocess.run(
                [sys.executable, 'test_cache_persistence.py'],
                capture_output=True,
                text=True,
                cwd=os.path.dirname(os.path.abspath(__file__))
            )
            
            # 分析输出
            output = result.stdout
            success = result.returncode == 0 and "所有测试完成" in output
            
            # 统计测试结果
            test_count = output.count("测试完成")
            error_count = output.count("✗")
            
            self.test_results['basic_functionality'] = {
                'success': success,
                'test_count': test_count,
                'error_count': error_count,
                'details': '基础缓存、持久化和清理机制测试',
                'output': output[-500:] if len(output) > 500 else output  # 保留最后500字符
            }
            
            print(f"✓ 基础功能测试完成 - 成功: {success}, 测试数: {test_count}, 错误数: {error_count}")
            
        except Exception as e:
            self.test_results['basic_functionality'] = {
                'success': False,
                'error': str(e),
                'details': '基础功能测试执行失败'
            }
            print(f"✗ 基础功能测试失败: {str(e)}")
    
    def run_robustness_tests(self):
        """运行健壮性测试"""
        print("\n=== 运行健壮性测试 ===")
        try:
            # 直接导入并运行健壮性测试
            from test_robustness import RobustnessTestSuite
            
            test_suite = RobustnessTestSuite()
            assessment = test_suite.run_all_tests()
            
            self.test_results['robustness'] = {
                'success': assessment['success_rate'] >= 80,
                'success_rate': assessment['success_rate'],
                'total_tests': assessment['total_tests'],
                'passed_tests': assessment['passed_tests'],
                'failed_tests': assessment['failed_tests'],
                'grade': assessment['grade'],
                'assessment': assessment['assessment'],
                'details': '边界条件、异常处理、并发操作、数据完整性测试'
            }
            
            print(f"✓ 健壮性测试完成 - 成功率: {assessment['success_rate']:.1f}%, 评级: {assessment['grade']}")
            
        except Exception as e:
            self.test_results['robustness'] = {
                'success': False,
                'error': str(e),
                'details': '健壮性测试执行失败'
            }
            print(f"✗ 健壮性测试失败: {str(e)}")
    
    def run_stress_tests(self):
        """运行压力测试"""
        print("\n=== 运行压力测试 ===")
        try:
            # 直接导入并运行压力测试
            from test_stress import StressTestSuite
            
            test_suite = StressTestSuite()
            report = test_suite.run_stress_tests()
            
            self.test_results['stress_performance'] = {
                'success': report['success_rate'] >= 60,
                'success_rate': report['success_rate'],
                'total_tests': report['total_tests'],
                'passed_tests': report['passed_tests'],
                'grade': report['grade'],
                'assessment': report['assessment'],
                'memory_change': report['memory_change'],
                'details': '高容量操作、并发压力、长时间运行、内存管理测试'
            }
            
            print(f"✓ 压力测试完成 - 成功率: {report['success_rate']:.1f}%, 评级: {report['grade']}")
            
        except Exception as e:
            self.test_results['stress_performance'] = {
                'success': False,
                'error': str(e),
                'details': '压力测试执行失败'
            }
            print(f"✗ 压力测试失败: {str(e)}")
    
    def generate_comprehensive_report(self):
        """生成综合评估报告"""
        print("\n" + "="*80)
        print("TaskQueueManager 核心逻辑健壮性综合评估报告")
        print("="*80)
        print(f"评估时间: {self.assessment_time.strftime('%Y-%m-%d %H:%M:%S')}")
        
        # 1. 测试概览
        print("\n📊 测试概览")
        print("-" * 40)
        
        total_categories = 0
        passed_categories = 0
        
        for category, result in self.test_results.items():
            if result:
                total_categories += 1
                if result.get('success', False):
                    passed_categories += 1
                
                status = "✓" if result.get('success', False) else "✗"
                category_name = {
                    'basic_functionality': '基础功能',
                    'robustness': '健壮性',
                    'stress_performance': '压力性能'
                }.get(category, category)
                
                print(f"{status} {category_name}: {result.get('details', 'N/A')}")
                
                if 'success_rate' in result:
                    print(f"    成功率: {result['success_rate']:.1f}%")
                if 'grade' in result:
                    print(f"    评级: {result['grade']}")
        
        overall_success_rate = (passed_categories / total_categories * 100) if total_categories > 0 else 0
        
        # 2. 详细分析
        print("\n📋 详细分析")
        print("-" * 40)
        
        # 基础功能分析
        basic = self.test_results.get('basic_functionality')
        if basic:
            print(f"\n🔧 基础功能测试:")
            if basic.get('success'):
                print(f"   ✓ 所有核心功能正常工作")
                print(f"   ✓ 缓存机制运行正常")
                print(f"   ✓ 持久化机制运行正常")
                print(f"   ✓ 清理机制运行正常")
            else:
                print(f"   ✗ 基础功能存在问题")
                if 'error' in basic:
                    print(f"   错误: {basic['error']}")
        
        # 健壮性分析
        robustness = self.test_results.get('robustness')
        if robustness:
            print(f"\n🛡️ 健壮性测试:")
            if robustness.get('success'):
                print(f"   ✓ 边界条件处理良好")
                print(f"   ✓ 异常处理机制完善")
                print(f"   ✓ 并发操作安全")
                print(f"   ✓ 数据完整性保证")
            else:
                print(f"   ⚠️ 健壮性需要改进")
                if 'failed_tests' in robustness and robustness['failed_tests'] > 0:
                    print(f"   失败测试数: {robustness['failed_tests']}")
        
        # 压力性能分析
        stress = self.test_results.get('stress_performance')
        if stress:
            print(f"\n⚡ 压力性能测试:")
            if stress.get('success'):
                print(f"   ✓ 高负载处理能力良好")
                print(f"   ✓ 内存管理有效")
                print(f"   ✓ 长时间运行稳定")
            else:
                print(f"   ⚠️ 性能需要优化")
                if 'memory_change' in stress:
                    print(f"   内存变化: {stress['memory_change']:+.1f}MB")
        
        # 3. 综合评级
        print("\n🎯 综合评级")
        print("-" * 40)
        
        if overall_success_rate >= 90:
            overall_grade = "A+ (优秀)"
            overall_assessment = "系统具有优秀的健壮性和性能，可以安全地部署到生产环境。"
            recommendations = [
                "继续保持高质量的代码标准",
                "定期进行回归测试",
                "监控生产环境性能指标"
            ]
        elif overall_success_rate >= 75:
            overall_grade = "A (良好)"
            overall_assessment = "系统整体表现良好，具有较好的健壮性，适合生产环境使用。"
            recommendations = [
                "重点优化失败的测试用例",
                "加强异常处理机制",
                "定期进行性能调优"
            ]
        elif overall_success_rate >= 60:
            overall_grade = "B (一般)"
            overall_assessment = "系统基本可用，但存在一些问题需要解决后再部署到生产环境。"
            recommendations = [
                "修复所有失败的测试用例",
                "重点改进健壮性和异常处理",
                "进行性能优化",
                "增加监控和日志"
            ]
        elif overall_success_rate >= 40:
            overall_grade = "C (较差)"
            overall_assessment = "系统存在较多问题，需要大量改进工作。"
            recommendations = [
                "全面重构异常处理机制",
                "优化核心算法和数据结构",
                "加强并发控制",
                "进行全面的代码审查"
            ]
        else:
            overall_grade = "D (差)"
            overall_assessment = "系统存在严重问题，不建议在当前状态下使用。"
            recommendations = [
                "重新设计核心架构",
                "重写关键组件",
                "建立完善的测试体系",
                "进行全面的质量保证"
            ]
        
        print(f"总体成功率: {overall_success_rate:.1f}%")
        print(f"综合评级: {overall_grade}")
        print(f"\n📝 评估结论:")
        print(f"{overall_assessment}")
        
        # 4. 改进建议
        print("\n💡 改进建议")
        print("-" * 40)
        for i, recommendation in enumerate(recommendations, 1):
            print(f"{i}. {recommendation}")
        
        # 5. 技术指标总结
        print("\n📈 技术指标总结")
        print("-" * 40)
        
        if robustness and 'success_rate' in robustness:
            print(f"健壮性成功率: {robustness['success_rate']:.1f}%")
        
        if stress and 'success_rate' in stress:
            print(f"压力测试成功率: {stress['success_rate']:.1f}%")
        
        if basic and basic.get('success'):
            print(f"基础功能: 正常")
        
        # 6. 风险评估
        print("\n⚠️ 风险评估")
        print("-" * 40)
        
        risks = []
        
        if not basic or not basic.get('success'):
            risks.append("高风险: 基础功能不稳定")
        
        if robustness and robustness.get('success_rate', 0) < 80:
            risks.append("中风险: 异常处理能力不足")
        
        if stress and stress.get('success_rate', 0) < 60:
            risks.append("中风险: 高负载性能问题")
        
        if not risks:
            print("✓ 未发现重大风险")
        else:
            for risk in risks:
                print(f"⚠️ {risk}")
        
        return {
            'overall_success_rate': overall_success_rate,
            'overall_grade': overall_grade,
            'overall_assessment': overall_assessment,
            'recommendations': recommendations,
            'risks': risks,
            'test_results': self.test_results
        }
    
    def save_report(self, report, filename="assessment_report.json"):
        """保存评估报告到文件"""
        report_data = {
            'assessment_time': self.assessment_time.isoformat(),
            'report': report
        }
        
        try:
            with open(filename, 'w', encoding='utf-8') as f:
                json.dump(report_data, f, ensure_ascii=False, indent=2)
            print(f"\n📄 评估报告已保存到: {filename}")
        except Exception as e:
            print(f"\n❌ 保存报告失败: {str(e)}")
    
    def run_comprehensive_assessment(self):
        """运行综合评估"""
        print("开始TaskQueueManager核心逻辑健壮性综合评估...\n")
        
        # 运行所有测试
        self.run_basic_tests()
        self.run_robustness_tests()
        self.run_stress_tests()
        
        # 生成综合报告
        report = self.generate_comprehensive_report()
        
        # 保存报告
        self.save_report(report)
        
        return report

def main():
    """主函数"""
    assessment = ComprehensiveAssessment()
    return assessment.run_comprehensive_assessment()

if __name__ == "__main__":
    main()