Python Django性能测试与优化指南

资讯频道 → 研发管理

0顶
0踩

2017-12-13 10:20 by 副主编 jihong10102006 评论(0) 有15410人浏览

Python Django 性能测试

声明：ITeye资讯文章的版权属于ITeye网站所有，严禁任何网站转载本文，否则必将追究法律责任！

原文：A Guide to Performance Testing and Optimization With Python and Django
作者：IULIAN GULEA
翻译：雁惊寒

摘要：本文通过一个简单的实例一步一步引导读者对其进行全方位的性能优化。以下是译文。

唐纳德·克努特（Donald Knuth）曾经说过：“不成熟的优化方案是万恶之源。”然而，任何一个承受高负载的成熟项目都不可避免地需要进行优化。在本文中，我想谈谈优化Web项目代码的五种常用方法。虽然本文是以Django为例，但其他框架和语言的优化原则也是类似的。通过使用这些优化方法，文中例程的查询响应时间从原来的77秒减少到了3.7秒。

Guide to Performance Optimization and Performance Testing With Python and Django

本文用到的例程是从一个我曾经使用过的真实项目改编而来的，是性能优化技巧的典范。如果你想自己尝试着进行优化，可以在GitHub上获取优化前的初始代码，并跟着下文做相应的修改。我使用的是Python 2，因为一些第三方软件包还不支持Python 3。

示例代码介绍

这个Web项目只是简单地跟踪每个地区的房产价格。因此，只有两种模型：

# houses/models.py
from utils.hash import Hasher


class HashableModel(models.Model):
    """Provide a hash property for models."""
    class Meta:
        abstract = True

    @property
    def hash(self):
        return Hasher.from_model(self)


class Country(HashableModel):
    """Represent a country in which the house is positioned."""
    name = models.CharField(max_length=30)

    def __unicode__(self):
        return self.name


class House(HashableModel):
    """Represent a house with its characteristics."""
    # Relations
    country = models.ForeignKey(Country, related_name='houses')

    # Attributes
    address = models.CharField(max_length=255)
    sq_meters = models.PositiveIntegerField()
    kitchen_sq_meters = models.PositiveSmallIntegerField()
    nr_bedrooms = models.PositiveSmallIntegerField()
    nr_bathrooms = models.PositiveSmallIntegerField()
    nr_floors = models.PositiveSmallIntegerField(default=1)
    year_built = models.PositiveIntegerField(null=True, blank=True)
    house_color_outside = models.CharField(max_length=20)
    distance_to_nearest_kindergarten = models.PositiveIntegerField(null=True, blank=True)
    distance_to_nearest_school = models.PositiveIntegerField(null=True, blank=True)
    distance_to_nearest_hospital = models.PositiveIntegerField(null=True, blank=True)
    has_cellar = models.BooleanField(default=False)
    has_pool = models.BooleanField(default=False)
    has_garage = models.BooleanField(default=False)
    price = models.PositiveIntegerField()

    def __unicode__(self):
        return '{} {}'.format(self.country, self.address)

抽象类HashableModel提供了一个继承自模型并包含hash属性的模型，这个属性包含了实例的主键和模型的内容类型。这能够隐藏像实例ID这样的敏感数据，而用散列进行代替。如果项目中有多个模型，而且需要在一个集中的地方对模型进行解码并要对不同类的不同模型实例进行处理时，这可能会非常有用。请注意，对于本文的这个小项目，即使不用散列也照样可以处理，但使用散列有助于展示一些优化技巧。

这是Hasher类：

# utils/hash.py
import basehash


class Hasher(object):
    @classmethod
    def from_model(cls, obj, klass=None):
        if obj.pk is None:
            return None
        return cls.make_hash(obj.pk, klass if klass is not None else obj)

    @classmethod
    def make_hash(cls, object_pk, klass):
        base36 = basehash.base36()
        content_type = ContentType.objects.get_for_model(klass, for_concrete_model=False)
        return base36.hash('%(contenttype_pk)03d%(object_pk)06d' % {
            'contenttype_pk': content_type.pk,
            'object_pk': object_pk
        })

    @classmethod
    def parse_hash(cls, obj_hash):
        base36 = basehash.base36()
        unhashed = '%09d' % base36.unhash(obj_hash)
        contenttype_pk = int(unhashed[:-6])
        object_pk = int(unhashed[-6:])
        return contenttype_pk, object_pk

    @classmethod
    def to_object_pk(cls, obj_hash):    
        return cls.parse_hash(obj_hash)[1]

由于我们想通过API来提供这些数据，所以我们安装了Django REST框架并定义以下序列化器和视图：

# houses/serializers.py
class HouseSerializer(serializers.ModelSerializer):
    """Serialize a `houses.House` instance."""

    id = serializers.ReadOnlyField(source="hash")
    country = serializers.ReadOnlyField(source="country.hash")

    class Meta:
        model = House
        fields = (
            'id',
            'address',
            'country',
            'sq_meters',
            'price'
        )

# houses/views.py
class HouseListAPIView(ListAPIView):
    model = House
    serializer_class = HouseSerializer
    country = None

    def get_queryset(self):
        country = get_object_or_404(Country, pk=self.country)
        queryset = self.model.objects.filter(country=country)
        return queryset

    def list(self, request, *args, **kwargs):
        # Skipping validation code for brevity
        country = self.request.GET.get("country")
        self.country = Hasher.to_object_pk(country)
        queryset = self.get_queryset()

        serializer = self.serializer_class(queryset, many=True)

        return Response(serializer.data)

现在，我们将用一些数据来填充数据库（使用factory-boy生成10万个房屋的实例：一个地区5万个，另一个4万个，第三个1万个），并准备测试应用程序的性能。

性能优化其实就是测量

在一个项目中我们需要测量下面这几个方面：

执行时间
代码的行数
函数调用次数
分配的内存
其他

但是，并不是所有这些都要用来度量项目的执行情况。一般来说，有两个指标比较重要：执行多长时间、需要多少内存。

在Web项目中，响应时间（服务器接收由某个用户的操作产生的请求，处理该请求并返回结果所需的总的时间）通常是最重要的指标，因为过长的响应时间会让用户厌倦等待，并切换到浏览器中的另一个选项卡页面。

在编程中，分析项目的性能被称为profiling。为了分析API的性能，我们将使用Silk包。在安装完这个包，并调用/api/v1/houses/?country=5T22RI后，可以得到如下的结果：

200 GET 
/api/v1/houses/

77292ms overall
15854ms on queries
50004 queries

整体响应时间为77秒，其中16秒用于查询数据库，总共有5万次查询。这几个数字很大，提升空间也有很大，所以，我们开始吧。

1. 优化数据库查询

性能优化最常见的技巧之一是对数据库查询进行优化，本案例也不例外。同时，还可以对查询做多次优化来减小响应时间。

1.1 一次提供所有数据

仔细看一下这5万次查询查的是什么：都是对houses_country表的查询：

200 GET 
/api/v1/houses/

77292ms overall
15854ms on queries
50004 queries

时间戳表名联合执行时间（毫秒）

+0:01 :15.874374	“houses_country”	0.176
+0:01 :15.873304	“houses_country”	0.218
+0:01 :15.872225	“houses_country”	0.218
+0:01 :15.871155	“houses_country”	0.198
+0:01 :15.870099	“houses_country”	0.173
+0:01 :15.869050	“houses_country”	0.197
+0:01 :15.867877	“houses_country”	0.221
+0:01 :15.866807	“houses_country”	0.203
+0:01 :15.865646	“houses_country”	0.211
+0:01 :15.864562	“houses_country”	0.209
+0:01 :15.863511	“houses_country”	0.181
+0:01 :15.862435	“houses_country”	0.228
+0:01 :15.861413	“houses_country”	0.174

这个问题的根源是，Django中的查询是惰性的。这意味着在你真正需要获取数据之前它不会访问数据库。同时，它只获取你指定的数据，如果需要其他附加数据，则要另外发出请求。

这正是本例程所遇到的情况。当通过House.objects.filter(country=country)来获得查询集时，Django将获取特定地区的所有房屋。但是，在序列化一个house实例时，HouseSerializer需要房子的country实例来计算序列化器的country字段。由于地区数据不在查询集中，所以django需要提出额外的请求来获取这些数据。对于查询集中的每一个房子都是如此，因此，总共是五万次。

当然，解决方案非常简单。为了提取所有需要的序列化数据，你可以在查询集上使用select_related()。因此，get_queryset函数将如下所示：

def get_queryset(self):
    country = get_object_or_404(Country, pk=self.country)
    queryset = self.model.objects.filter(country=country).select_related('country')
    return queryset

我们来看看这对性能有何影响：

200 GET
/api/v1/houses/

35979ms overall
102ms on queries
4 queries

总体响应时间降至36秒，在数据库中花费的时间约为100ms，只有4个查询！这是个好消息，但我们可以做得更多。

1.2 仅提供相关的数据

默认情况下，Django会从数据库中提取所有字段。但是，当表有很多列很多行的时候，告诉Django提取哪些特定的字段就非常有意义了，这样就不会花时间去获取根本用不到的信息。在本案例中，我们只需要5个字段来进行序列化，虽然表中有17个字段。明确指定从数据库中提取哪些字段是很有意义的，可以进一步缩短响应时间。

Django可以使用defer()和only()这两个查询方法来实现这一点。第一个用于指定哪些字段不要加载，第二个用于指定只加载哪些字段。

def get_queryset(self):
    country = get_object_or_404(Country, pk=self.country)
    queryset = self.model.objects.filter(country=country)\
        .select_related('country')\
        .only('id', 'address', 'country', 'sq_meters', 'price')
    return queryset

这减少了一半的查询时间，非常不错。总体时间也略有下降，但还有更多提升空间。

200 GET
/api/v1/houses/

33111ms overall
52ms on queries
4 queries

2. 代码优化

你不能无限制地优化数据库查询，并且上面的结果也证明了这一点。即使把查询时间减少到0，我们仍然会面对需要等待半分钟才能得到应答这个现实。现在是时候转移到另一个优化级别上来了，那就是：业务逻辑。

2.1 简化代码

有时，第三方软件包对于简单的任务来说有着太大的开销。本文例程中返回的序列化的房子实例正说明了这一点。

Django REST框架非常棒，包含了很多有用的功能。但是，现在的主要目标是缩短响应时间，所以该框架是优化的候选对象，尤其是我们要使用的序列化对象这个功能非常的简单。

为此，我们来编写一个自定义的序列化器。为了方便起见，我们将用一个静态方法来完成这项工作。

# houses/serializers.py
class HousePlainSerializer(object):
    """
    Serializes a House queryset consisting of dicts with
    the following keys: 'id', 'address', 'country',
    'sq_meters', 'price'.
    """

    @staticmethod
    def serialize_data(queryset):
        """
        Return a list of hashed objects from the given queryset.
        """
        return [
            {
                'id': Hasher.from_pk_and_class(entry['id'], House),
                'address': entry['address'],
                'country': Hasher.from_pk_and_class(entry['country'], Country),
                'sq_meters': entry['sq_meters'],
                'price': entry['price']
            } for entry in queryset
        ]


# houses/views.py
class HouseListAPIView(ListAPIView):
    model = House
    serializer_class = HouseSerializer
    plain_serializer_class = HousePlainSerializer  # <-- added custom serializer
    country = None

    def get_queryset(self):
        country = get_object_or_404(Country, pk=self.country)
        queryset = self.model.objects.filter(country=country)
        return queryset

    def list(self, request, *args, **kwargs):
        # Skipping validation code for brevity
        country = self.request.GET.get("country")
        self.country = Hasher.to_object_pk(country)
        queryset = self.get_queryset()

        data = self.plain_serializer_class.serialize_data(queryset)  # <-- serialize

        return Response(data)

200 GET
/api/v1/houses/

17312ms overall
38ms on queries
4 queries

现在看起来好多了，由于没有使用DRF序列化代码，所以响应时间几乎减少了一半。

另外还有一个结果：在请求/响应周期内完成的总的函数调用次数从15,859,427次（上面1.2节的请求次数）减少到了9,257,469次。这意味着大约有三分之一的函数调用都是由Django REST Framework产生的。

2.2 更新或替代第三方软件包

上述几个优化技巧是最常见的，无需深入地分析和思考就可以做到。然而，17秒的响应时间仍然感觉很长。要减少这个时间，需要更深入地了解代码，分析底层发生了什么。换句话说，需要分析一下代码。

你可以自己使用Python内置的分析器来进行分析，也可以使用一些第三方软件包。由于我们已经使用了silk，它可以分析代码并生成一个二进制的分析文件，因此，我们可以做进一步的可视化分析。有好几个可视化软件包可以将二进制文件转换为一些友好的可视化视图。本文将使用snakeviz。

这是上文一个请求的二进制分析文件的可视化图表：

从上到下是调用堆栈，显示了文件名、函数名及其行号，以及该方法花费的时间。可以很容易地看出，时间大部分都用在计算散列上（紫罗兰色的__init__.py和primes.py矩形）。

目前，这是代码的主要性能瓶颈，但同时，这不是我们自己写的代码，而是用的第三方包。

在这种情况下，我们可以做的事情将非常有限：

检查包的最新版本（希望能有更好的性能）。
寻找另一个能够满足我们需求的软件包。
我们自己写代码，并且性能优于目前使用的软件包。

幸运的是，我们找到了一个更新版本的basehash包。原代码使用的是v.2.1.0，而新的是v.3.0.4。

当查看v.3的发行说明时，这一句话看起来令人充满希望：

“使用素数算法进行大规模的优化。”

让我们来看一下！

pip install -U basehash gmpy2

200 GET
/api/v1/houses/

7738ms overall
59ms on queries
4 queries

响应时间从17秒缩短到了8秒以内。太棒了！但还有一件事我们应该来看看。

2.3 重构代码

到目前为止，我们已经改进了查询、用自己特定的函数取代了第三方复杂而又泛型的代码、更新了第三方包，但是我们还是保留了原有的代码。但有时，对现有代码进行小规模的重构可能会带来意想不到的结果。但是，为此我们需要再次分析运行结果。

仔细看一下，你可以看到散列仍然是一个问题（毫不奇怪，这是我们对数据做的唯一的事情），虽然我们确实朝这个方向改进了，但这个绿色的矩形表示__init__.py花了2.14秒的时间，同时伴随着灰色的__init__.py:54(hash)。这意味着初始化工作需要很长的时间。

我们来看看basehash包的源代码。

# basehash/__init__.py

# Initialization of `base36` class initializes the parent, `base` class.
class base36(base):
    def __init__(self, length=HASH_LENGTH, generator=GENERATOR):
        super(base36, self).__init__(BASE36, length, generator)


class base(object):
    def __init__(self, alphabet, length=HASH_LENGTH, generator=GENERATOR):
        if len(set(alphabet)) != len(alphabet):
            raise ValueError('Supplied alphabet cannot contain duplicates.')

        self.alphabet = tuple(alphabet)
        self.base = len(alphabet)
        self.length = length
        self.generator = generator
        self.maximum = self.base ** self.length - 1
        self.prime = next_prime(int((self.maximum + 1) * self.generator))  # `next_prime` call on each initialized instance

正如你所看到的，一个base实例的初始化需要调用next_prime函数，这是太重了，我们可以在上面的可视化图表中看到左下角的矩形。

我们再来看看Hash类：

class Hasher(object):
    @classmethod
    def from_model(cls, obj, klass=None):
        if obj.pk is None:
            return None
        return cls.make_hash(obj.pk, klass if klass is not None else obj)

    @classmethod
    def make_hash(cls, object_pk, klass):
        base36 = basehash.base36()  # <-- initializing on each method call
        content_type = ContentType.objects.get_for_model(klass, for_concrete_model=False)
        return base36.hash('%(contenttype_pk)03d%(object_pk)06d' % {
            'contenttype_pk': content_type.pk,
            'object_pk': object_pk
        })

    @classmethod
    def parse_hash(cls, obj_hash):
        base36 = basehash.base36()  # <-- initializing on each method call
        unhashed = '%09d' % base36.unhash(obj_hash)
        contenttype_pk = int(unhashed[:-6])
        object_pk = int(unhashed[-6:])
        return contenttype_pk, object_pk

    @classmethod
    def to_object_pk(cls, obj_hash):    
        return cls.parse_hash(obj_hash)[1]

正如你所看到的，我已经标记了这两个方法初始化base36实例的方法，这并不是真正需要的。

由于散列是一个确定性的过程，这意味着对于一个给定的输入值，它必须始终生成相同的散列值，因此，我们可以把它作为类的一个属性。让我们来看看它将如何执行：

class Hasher(object):
    base36 = basehash.base36()  # <-- initialize hasher only once

    @classmethod
    def from_model(cls, obj, klass=None):
        if obj.pk is None:
            return None
        return cls.make_hash(obj.pk, klass if klass is not None else obj)

    @classmethod
    def make_hash(cls, object_pk, klass):
        content_type = ContentType.objects.get_for_model(klass, for_concrete_model=False)
        return cls.base36.hash('%(contenttype_pk)03d%(object_pk)06d' % {
            'contenttype_pk': content_type.pk,
            'object_pk': object_pk
        })

    @classmethod
    def parse_hash(cls, obj_hash):
        unhashed = '%09d' % cls.base36.unhash(obj_hash)
        contenttype_pk = int(unhashed[:-6])
        object_pk = int(unhashed[-6:])
        return contenttype_pk, object_pk

    @classmethod
    def to_object_pk(cls, obj_hash):    
        return cls.parse_hash(obj_hash)[1]

**200 GET**

  /api/v1/houses/

3766ms overall
38ms on queries
4 queries

最后的结果是在4秒钟之内，比我们一开始的时间要小得多。对响应时间的进一步优化可以通过使用缓存来实现，但是我不会在这篇文章中介绍这个。

结论

性能优化是一个分析和发现的过程。没有哪个硬性规定能适用于所有情况，因为每个项目都有自己的流程和瓶颈。然而，你应该做的第一件事是分析代码。如果在这样一个简短的例子中，我可以将响应时间从77秒缩短到3.7秒，那么对于一个庞大的项目来说，就会有更大的优化潜力。

分享到：

0
顶

0
踩

评论共 0 条请登录后发表评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

python性能优化全面指南

文章目录python、c++与文言文、白话文鱼和熊掌兼而得之创建一门新的语言，这门语言能够写起来像python，跑起来像c++JuliaNim拼命提升高级语言Python的运行效率将python转化成c、c++代码进行优化cythonnuitkapythran...

PythonDjango性能测试与优化指南

虽然本文是以Django为例，但其他框架和语言的优化原则也是类似的。通过使用这些优化方法，文中例程的查询响应时间从原来的77秒减少到了3.7秒。本文用到的例程是从一个我曾经使用过的真实项目改编而来的，是性能优化...

python django性能_Python Django性能测试与优化指南

虽然本文是以Django为例，但其他框架和语言的优化原则也是类似的。通过使用这些优化方法，文中例程的查询响应时间从原来的77秒减少到了3.7秒。?本文用到的例程是从一个我曾经使用过的真实项目改编而来的，是...

Python Django 性能测试与优化指南

唐纳德·克努特（Donald Knuth）曾经说过：“不成熟的优化方案是万恶之源。”然而，任何一个承受高负载的成熟项目都不可避免地需要进行优化。在本文中，我想谈谈优化Web项目代码的五种常用方法。虽然本文是以D

【Python django】零基础也能轻松掌握的学习路线与参考资料

Django官方文档：https://docs.djangoproject.com/en/3.2/Django官方文档：https://docs.djangoproject.com/en/3.2/Django官方文档：https://docs.djangoproject.com/en/3.2/Django中文文档：https://www.django.cn/

覆盖一系列高级主题，包括复杂的语法和特性、Python的高级编程技巧、常见的设计模式、并发编程、性能优化等

性能优化：提供关于Python代码性能优化的实践指南，包括算法优化、内存管理和代码优化技巧。网络编程和Web开发：涉及Python网络编程的高级主题，以及Web开发中的相关技术，如使用框架（例如Django或Flask）构建...

Django安全性、缓存框架、性能与优化

跨站点脚本（XSS）保护 XSS攻击使用户可以将客户端脚本注入其他用户的浏览器中...使用Django模板可以保护您免受大多数XSS攻击。但是，重要的是要了解其提供的保护及其限制。 Django模板会转义特定字符，这对于HTML来.

python django开发实战pdf_Django企业开发实战高效Python Web框架指南pdf免费版完整版...

开发工程师the5fire教你学会如何使用流行的Python，Web框架Django介绍Python Web框架Django在企业中的应用的书籍，从零开发到部署完整案例，Django企业开发实战高效Python Web框架指南电子版是开发工程师the5fire...

pythonweb框架django_Django企业开发实战高效Python Web框架指南

autocomplete-light优化性能222 10.2.1创造1万个分类223 10.2.2django-autocomplete-light介绍224 10.2.3引入插件224 10.2.4总结226 10.2.5参考资料226 10.3使用django-ckeditor开发富文本编辑器226 10.3.1基础配置...

Django 企业级接口自动化测试平台实战（一）

Python的WEB框架有Django、Tornado、Flask 等多种，Django是重量级选手中最有代表性的一位，它的优势为：大而全，框架本身集成了ORM、模型绑定、模板引擎、缓存、Session等诸多功能。许多成功的网站和APP都基于...

【Python百宝箱】掌握Python Web开发三剑客：Flask、Django、FastAPI一网打尽

本文全面介绍了Flask、Django和FastAPI这三个主流的Python Web框架，以及与之相关的数据库、ORM库、安全性与认证、前端框架与交互、测试与调试工具。每个部分都包含详细的介绍和实例代码，帮助读者理解框架的核心...

python源码基于YOLOV5安全帽检测系统及危险区域入侵检测告警系统源码.rar

本资源提供了一个基于YOLOv5的安全帽检测系统及危险区域入侵检测告警系统的Python源码该系统主要利用深度学习和计算机视觉技术，实现了安全帽和危险区域入侵的实时检测与告警。具体功能如下： 1. 安全帽检测：系统能够识别并检测工人是否佩戴安全帽，对于未佩戴安全帽的工人，系统会发出告警信号，提醒工人佩戴安全帽。 2. 危险区域入侵检测：系统能够实时监测危险区域，如高空作业、机械设备等，对于未经授权的人员或车辆进入危险区域，系统会立即发出告警信号，阻止入侵行为，确保安全。本资源采用了YOLOv5作为目标检测算法，该算法基于深度学习和卷积神经网络，具有较高的检测精度和实时性能。同时，本资源还提供了详细的使用说明和示例代码，便于用户快速上手和实现二次开发。运行测试ok，课程设计高分资源，放心下载使用！该资源适合计算机相关专业(如人工智能、通信工程、自动化、软件工程等)的在校学生、老师或者企业员工下载，适合小白学习或者实际项目借鉴参考！当然也可作为毕业设计、课程设计、课程作业、项目初期立项演示等。如果基础还行，可以在此代码基础之上做改动以实现更多功能，如增加多种安全帽和危险区域的识别、支持多种传感器数据输入、实现远程监控等。

基于SpringBoot的响应式技术博客的设计和实现(源码+文档)

本课题将许多当前比较热门的技术框架有机的集合起来，比如Spring boot、Spring data、Elasticsearch等。同时采用Java8作为主要开发语言，利用新型API，改善传统的开发模式和代码结构，实现了具有实时全文搜索、博客编辑、分布式文件存贮和能够在浏览器中适配移动端等功能的响应式技术博客。本毕业设计选用SpringBoot框架，结合Thymeleaf，SpringData，SpringSecurity，Elasticsearch等技术，旨在为技术人员设计并实现一款用于记录并分享技术文档的技术博客。通过该技术博客，方便技术人员记录自己工作和学习过程中的点滴，不断地进行技术的总结和积累，从而提升自己的综合能力，并通过博客这一平台，把自己的知识、经验、教训分享给大家，为志同道合者提供一个相互交流、共同学习的平台，促使更多的人共同进步[9]。学习到别人的一些良好的设计思路、编码风格和优秀的技术能力，使笔者的设计初衷。本系统主要面向web端的用户，希望能给用户更多的学习和交流的选择。

javalab 3.zip

J0001基于javaWeb的健身房管理系统设计与实现

该系统基于javaweb整合，数据层为MyBatis，mysql数据库，具有完整的业务逻辑，适合选题：健身、健身房、健身房管理等健身房管理系统开发使用JSP技术和MySQL数据库，该系统所使用的是Java语言，Java是目前最为优秀的面相对象的程序设计语言，只需要开发者对概念有一些了解就可以编写出程序，因此，开发该系统总体上不会有很大的难度，同时在开发系统时，所使用的数据库也是必不可少的。开发此系统所使用的技术都是通过在大学期间学习的，对每科课程都有很好的掌握，对系统的开发具有很好的判断性。因此，在完成该系统的开发建设时所使用的技术是完全可行的。学员主要实现的功能有：网站信息、课程信息、教练列表、我的信息、登录员工主要实现的功能有：工资查询、会员管理、器材借还、健身卡管理、个人中心、登录教练主要实现的功能有：工资查询、学员列表、个人中心管理员是系统的核心，可以对系统信息进行更新和维护，主要实现的功能有：个人中心、学员管理、教练管理、网站信息管理、器械信息管理、课程信息管理。

架构.cpp

利用Python实现中文文本关键词抽取（三种方法）

文本关键词抽取，是对文本信息进行高度凝练的一种有效手段，通过3-5个词语准确概括文本的主题，帮助读者快速理解文本信息。目前，用于文本关键词提取的主要方法有四种：基于TF-IDF的关键词抽取、基于TextRank的关键词抽取、基于Word2Vec词聚类的关键词抽取，以及多种算法相融合的关键词抽取。笔者在使用前三种算法进行关键词抽取的学习过程中，发现采用TF-IDF和TextRank方法进行关键词抽取在网上有很多的例子，代码和步骤也比较简单，但是采用Word2Vec词聚类方法时网上的资料并未把过程和步骤表达的很清晰。因此，本文分别采用 1. TF-IDF方法 2. TextRank方 3. Word2Vec词聚类方法实现对专利文本（同样适用于其它类型文本）的关键词抽取，通过理论与实践相结合的方式，一步步了解、学习、实现中文文本关键词抽取。

演示Asm字节码插桩asmd-demo-master.zip

VB+access干部档案管理系统(源代码+系统).zip

档案是国家机构、社会组织在干部管理活动中形成的、记述和反映个人经历和德才表现等情况、以人头为单位集中保存以备查考的原始记录。档案管理的目的是为了档案的利用。如果放松管理，无论对单位和对个人都会影响档案的利用。举个例子，如果应该进入档案的材料没及时归档，则对个人资料的记载就是不完整的，缺乏了这一部分的凭证，就无法出具相关证明。如果发生了损坏或丢失档案的情况，后果就更加严重，有的档案材料是难以重新建立的。档案的管理是与干部、流动手续的衔接密切相关的。以北京市人才服务中心为例，拥有着全市最大的档案管理中心，共保管了档案12万份。这些档案的利用率相对很高，表现在出具干部证明、婚育证明、出国政审、职称评定、工龄认定以及各种保险的相关手续等方面。档案中心的工作人员每天都要接待大量的企业用人中的查询、查阅。档案好像是计划经济的产物，在市场经济条件下，随着人才流动潮流的涌现，人们思想观念上的放开，档案越来越被人们所冷落和忽视。到底档案对个人以及人力资源部意味着什么，放松对档案的管理会带来哪些后果呢？目前我国的档案管理社会化趋势日益明显。非公有制单位，国有企业事业单位发展干部代理使流动人员档案管理

本算法是结合“时间遗忘曲线”和“物品类….zip

协同过滤算法（Collaborative Filtering）是一种经典的推荐算法，其基本原理是“协同大家的反馈、评价和意见，一起对海量的信息进行过滤，从中筛选出用户可能感兴趣的信息”。它主要依赖于用户和物品之间的行为关系进行推荐。协同过滤算法主要分为两类：基于物品的协同过滤算法：给用户推荐与他之前喜欢的物品相似的物品。基于用户的协同过滤算法：给用户推荐与他兴趣相似的用户喜欢的物品。协同过滤算法的优点包括：无需事先对商品或用户进行分类或标注，适用于各种类型的数据。算法简单易懂，容易实现和部署。推荐结果准确性较高，能够为用户提供个性化的推荐服务。然而，协同过滤算法也存在一些缺点：对数据量和数据质量要求较高，需要大量的历史数据和较高的数据质量。容易受到“冷启动”问题的影响，即对新用户或新商品的推荐效果较差。存在“同质化”问题，即推荐结果容易出现重复或相似的情况。协同过滤算法在多个场景中有广泛的应用，如电商推荐系统、社交网络推荐和视频推荐系统等。在这些场景中，协同过滤算法可以根据用户的历史行为数据，推荐与用户兴趣相似的商品、用户或内容，从而提高用户的购买转化率、活跃度和社交体验。未来，协同过滤算法的发展方向可能是结合其他推荐算法形成混合推荐系统，以充分发挥各算法的优势。

0顶0踩